GPT-5.5のサイバー攻撃能力は一部「Mythos超え」 英政府機関が評価
英国政府の研究機関AI Security Institute(AISI)は4月30日(現地時間)、米OpenAIの新モデル「GPT-5.5」のサイバーセキュリティ能力が、4月に評価した米Anthropicの「Claude Mythos Preview」(以下、Mythos)と同等の水準に達したとする評価結果を公表した。同機関は、サイバー攻撃能力の急速な向上が特定のモデルに限った話ではなく、業界全体の傾向である可能性を示唆している。
AISIはGPT-5.5に対して、Mythosの検証時と同様、2種類の評価を実施した。
1つ目はシステムの脆弱(ぜいじゃく)性を突いて隠された情報を奪取する「capture-the-flag」(CTF)形式の評価だ。タスクの難易度別に実施された。最難関の「Expert」レベルでは、GPT-5.5の平均成功率は71.4%に達し、Mythosの68.6%を上回った。
2つ目は実のサイバー攻撃手法を再現した「Cyber Range」と呼ばれる評価だ。その中でも、初期偵察からネットワークの完全掌握までを再現した32段階の企業ネットワーク攻撃シミュレーション「The Last Ones」(TLO)では、10回中2回で全工程を完遂。10回中3回全工程を完遂したMythosに次いで、同シミュレーションを完遂した2つ目のモデルとなった。成功した工程数の平均については詳細な数値が明かされていないが、グラフを読み取る限りは両モデルのパフォーマンスは同等だ。
産業制御システムの攻撃シミュレーション「Cooling Tower」は突破できなかった。同シミュレーションはまだどのモデルも突破できていない。
AISIは、今回の検証が研究環境で実施されたものであり、GPT-5.5の一般ユーザーがアクセスできる能力を示すとは限らないとした。
同機関は、強力なサイバーセキュリティ能力を持つモデルが2つの異なる事業者からリリースされたことから、AIモデルにおけるサイバーセキュリティ能力の急速な向上が業界の一般的な傾向である可能性を示唆した。
また、サイバーセキュリティ能力が、自律性や推論、コーディングといった一般的なモデルの進歩の副産物ならば、近い将来、複数のモデルにおいてこの能力が相次いで向上することが予想されるとした。
なお、GPT-5.5の一般公開版には追加のセキュリティ対策が施されているため、AISIはその対策能力も検証した。専門家による約6時間の演習で、OpenAIから提供された全ての悪意あるサイバー関連クエリに対し、違反コンテンツを生成させることに成功した。
OpenAIはその後、セキュリティ対策を複数回更新したが、提供されたバージョンの設定不備により、同機関は最終的な有効性を検証できなかったとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ChatGPT vs. Google検索──どっちで調べるのが学習効果が高い? 8日間の実験で検証した研究
-
2
Sakana AI、初の商用プロダクト「Marlin」リリース その実力は?【出力レポート全文掲載】
-
3
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
4
人工知能学会「AIは人間を代替しない」 社会実装へ4提言 安保・著作権にも言及
-
5
データセンターの見回り業務をロボットに 自在に伸びるカメラでくまなく点検できる「ugo mini」
-
6
Sakana AI、初の商用サービスはリサーチ特化 「Deep Research」との違いは? 後発で“ベンチマークも追わない”ワケ
-
7
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
-
8
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
9
最新AI「Fable 5」でYouTube動画作ってみた 想像以上の出来に驚愕、ただし大きな弱点も
-
10
“ChatGPTアダルトモード”実現なるか──適切なエロ&グロコンテンツの生成方法を模索中とOpenAI
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR