マイページ

注目記事を集めた総合ページ

ITの今と未来を見通す

スマホと通信の最新トレンド

進化するPCとデバイスの未来

好きが集まる　比べて選べる

ビジネスと働き方のヒント

AI活用のいまが分かる

企業ITのトレンドを詳説

経営リーダーのコミュニティ

マーケ×ITの今がよく分かる

ITエンジニア向け専門サイト

企業向けIT製品の総合サイト

IT製品の技術・比較・事例

製造業のIT導入・活用を支援

モノづくり技術者専門サイト

エレクトロニクス専門サイト

電子設計の基本と応用

エネルギーの専門メディア

建設×テクノロジーの最前線

ちょっと気になるネットの話題

GPT-5.5のサイバー攻撃能力は一部「Mythos超え」　英政府機関が評価

公開 2026年05月01日 17時27分

著者

[ITmedia]

印刷する

　英国政府の研究機関AI Security Institute（AISI）は4月30日（現地時間）、米OpenAIの新モデル「GPT-5.5」のサイバーセキュリティ能力が、4月に評価した米Anthropicの「Claude Mythos Preview」（以下、Mythos）と同等の水準に達したとする評価結果を公表した。同機関は、サイバー攻撃能力の急速な向上が特定のモデルに限った話ではなく、業界全体の傾向である可能性を示唆している。

　AISIはGPT-5.5に対して、Mythosの検証時と同様、2種類の評価を実施した。

　1つ目はシステムの脆弱（ぜいじゃく）性を突いて隠された情報を奪取する「capture-the-flag」（CTF）形式の評価だ。タスクの難易度別に実施された。最難関の「Expert」レベルでは、GPT-5.5の平均成功率は71.4％に達し、Mythosの68.6％を上回った。

それぞれのモデルにおけるCTFの平均成功率（出典：公式ブログ）

　2つ目は実のサイバー攻撃手法を再現した「Cyber Range」と呼ばれる評価だ。その中でも、初期偵察からネットワークの完全掌握までを再現した32段階の企業ネットワーク攻撃シミュレーション「The Last Ones」（TLO）では、10回中2回で全工程を完遂。10回中3回全工程を完遂したMythosに次いで、同シミュレーションを完遂した2つ目のモデルとなった。成功した工程数の平均については詳細な数値が明かされていないが、グラフを読み取る限りは両モデルのパフォーマンスは同等だ。

それぞれのモデルにおけるTLOで成功した工程数の平均（出典：公式ブログ）

　産業制御システムの攻撃シミュレーション「Cooling Tower」は突破できなかった。同シミュレーションはまだどのモデルも突破できていない。

　AISIは、今回の検証が研究環境で実施されたものであり、GPT-5.5の一般ユーザーがアクセスできる能力を示すとは限らないとした。

　同機関は、強力なサイバーセキュリティ能力を持つモデルが2つの異なる事業者からリリースされたことから、AIモデルにおけるサイバーセキュリティ能力の急速な向上が業界の一般的な傾向である可能性を示唆した。

　また、サイバーセキュリティ能力が、自律性や推論、コーディングといった一般的なモデルの進歩の副産物ならば、近い将来、複数のモデルにおいてこの能力が相次いで向上することが予想されるとした。

　なお、GPT-5.5の一般公開版には追加のセキュリティ対策が施されているため、AISIはその対策能力も検証した。専門家による約6時間の演習で、OpenAIから提供された全ての悪意あるサイバー関連クエリに対し、違反コンテンツを生成させることに成功した。

　OpenAIはその後、セキュリティ対策を複数回更新したが、提供されたバージョンの設定不備により、同機関は最終的な有効性を検証できなかったとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

印刷する

SpecialPR

この記事の著者

村田知己

ITmedia AI＋編集記者。市場調査会社でのエンジニア職を経て、2022年アイティメディア入社。キーマンズネット編集部、社内のデータ分析基盤構築担当、ITmedia エンタープライズ編集部を経て現職。

関連記事

SpecialPR

メールマガジンを配信中

メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

メールマガジン最新号

「Kimi K3」のモデルウェイトと技術レポート公開　日本でも「NVIDIA B300×8」環境での利用報告 Anthropic、著作権訴訟で史上最大「2400億円」和解金支払いへ　学習利用は「フェアユース」認定／今週抑えるべき「Noetra本格始動」と「Kimi K3到来」

SpecialPR

よく見られているカテゴリー

アクセスランキング

もっと見る

SpecialPR

ITmedia AI＋ SNS

@itm_aiplusをフォロー

インフォメーション

注目情報をチェック

お問い合わせ

広告に関するお問い合わせ

ITmedia AI＋をフォロー

あなたにおすすめの記事PR