Anthropicは未公開のAIモデルが脆弱性発見能力で優れた能力を発揮した現状を受け、主要企業や各種組織と連携し防御目的で活用する枠組みを発表した。
この記事は会員限定です。会員登録すると全てご覧いただけます。
Anthropicは2026年4月7日(現地時間)、重要ソフトウェアの安全性強化を目的とする新たな共同枠組み「Project Glasswing」を発表した。参加企業にはAmazon Web Services(AWS)、Apple、Google、Microsoft、NVIDIAなど主要テクノロジー企業に加え、金融やセキュリティ分野の組織も含まれる。AIの進展によってサイバー攻撃と防御の構図が大きく変化する可能性があるとの認識から、各社が連携し対策を推進する。
背景には、Anthropicが開発中の未公開AIモデル「Claude Mythos Preview」の能力がある。このモデルはソフトウェアの脆弱(ぜいじゃく)性を発見し、悪用手法を導き出す能力において高度な水準に達している。
Claude Mythos Previewは、既に主要なオペレーティングシステムやWebブラウザを含む、広範なソフトウェアから数千件の重大な欠陥を見つけている。こうした能力は今後広く普及する可能性があり、不適切な利用が拡大した場合、経済や公共安全、国家安全保障に深刻な影響を及ぼす懸念がある。
具体例として、「OpenBSD」に約27年前から存在した接続するだけでサーバを遠隔でクラッシュできる脆弱性や、「FFmpeg」に約16年前からあったバグ、Linuxカーネルにおける複数の脆弱性を明らかにし、それらを組み合わせてシステムの管理者権限を奪取する攻撃手法を発見したことなどが挙げられる。これらは既に開発者に報告され修正済みだ。モデルは多くの場合、人間の指示なしにこれらを特定した。
評価指標でも同モデルは「Claude Opus 4.6」などの従来モデルを大きく上回る性能を示している。脆弱性再現やコード生成、推論能力など複数のベンチマークで高いスコアを記録し、サイバー分野における能力の高さが裏付けられている。
Project Glasswingでは、このモデルを防御目的で活用する。参加企業は自社や基盤システムの検証にモデルを使い、脆弱性の発見と修正に取り組む。Anthropicは得られた知見を共有し、業界全体の安全性向上につなげる方針だ。また40以上の組織にもアクセスを提供し、オープンソースを含む重要インフラの安全性を確認する。
資金面においては、最大1億ドル相当の利用クレジットを提供する他、オープンソースセキュリティ団体に対し合計400万ドルを寄付する。Linux Foundation関連団体やApache Software Foundationにも資金を拠出し、開発者コミュニティーを支援する。
Anthropicはこのモデルを一般公開する予定はないが、将来的には安全対策を整えた上で同等の能力を持つモデルの実用化を目指す。その過程で危険な出力を検出、制御する仕組みを開発するとしている。
今後の計画として、参加企業間での情報共有やベストプラクティスを策定する他、2026年4月7日から90日以内に成果を公表する予定だ。脆弱性開示やソフトウェア更新、サプライチェーン管理などに関する指針の整備にも取り組む。米政府との協議も進めており、AIとサイバー安全保障の関係について連携を強化するという。
Google、「Gemma 4」を発表――高度な推論とエージェント機能を備える4種のモデル
Claude需要急増 Anthropic、Googleらと提携し大規模AIインフラ構築へ
内製化拡大で2桁成長 それでも「ノーコードツール」の先行きが暗い理由
品川区とSHIFTが生成AI実証実験 電話対応自動化で行政サービス向上図るCopyright © ITmedia, Inc. All Rights Reserved.