メディア

ついに『ターミネーター』の世界が到来？　AIが人間の力を借りずにサイバー攻撃を計画、実行してしまう：Cybersecurity Dive

カーネギーメロン大学の研究者は、大規模言語モデルが人間の介入なしに、自律的に計画を立てて高度なサイバー攻撃を実行したと発表した。データ侵害のシミュレーションでは、テストネットワークのうち5つを完全に侵害したという。

» 2025年08月15日 07時00分公開

[David Jones，Cybersecurity Dive]

この記事は会員限定です。会員登録すると全てご覧いただけます。

　カーネギーメロン大学の研究者は、大規模言語モデル（LLM）が人間の介入なしに、自律的に計画を立て、高度なサイバー攻撃を実行できることを実証した（注1）。

LLMによる自律的な攻撃が実現　その実力はいかに？

　研究は、AIに関するビジネスを展開するAnthropicと共同で実施されたものだ。研究においてAIはマルウェアをインストールし、データを盗み出すことで2017年に発生した「Equifax」に対するサイバー攻撃を再現した（注2）。

　大手信用情報機関であるEquifaxに対する侵害では、約1億4700万人の顧客データが流出し、米国市場最大級のデータ侵害事件の一つとなったものだ。

　カーネギーメロン大学とAnthropicの研究者は（注3）、「Incalmo」と呼ばれる攻撃ツールキットを開発した。これを使用してEquifaxに対する侵害の背後にあった戦略を攻撃の実行に使う具体的なシステムコマンドへと変換したのだ。

　カーネギーメロン大学の電気およびコンピュータ工学科の博士課程に在籍し、主任研究者を務めるブライアン・シンガー氏は、今回の研究の目的について「人間の助けを借りずに、LLMが自律的に攻撃計画を立てられる能力を測定することだった」と述べている。

　シンガー氏は「Cybersecurity Dive」に対して電子メールで次のように述べた。

　「Incalmoが他のネットワークにどの程度適用できるかは不明だ。しかし論文の執筆にあたり、私たちはIncalmoを10の小規模な企業環境で評価した。そのうち9つの環境で、LLMは一部の機密データを流出させるような成果を上げ、自律的な攻撃を部分的に成功させた」

　研究者たちによると、攻撃ではLLMが高いレベルの戦略的な指示を出し、スキャンや不正プログラムの展開といった低いレベルの作業は、LLMと非LLMのエージェントを組み合わせて実行したという。

　Anthropicが2025年6月に発表した内容によると、LLMは10のテストネットワークのうち5つを完全に侵害し（注4）、さらに4つを部分的に侵害したようだ。これらのテストで使用されたモデルの一つは、2021年に発生したColonial Pipelineに対するランサムウェア攻撃である（注5）。当時、攻撃によって燃料供給業務が1週間にわたって混乱した。

　Equifaxに対するセキュリティ侵害がシミュレーションの対象に選ばれたのは、実行方法に関する公開情報が豊富だったためである。

　このような自律型攻撃を現代の防御策で阻止できるかどうか聞かれたシンガー氏は「現時点では防御策がどの程度有効に機能するかは不明だ」と述べた。また同氏は、最大の懸念は、誰かの手によりこうした攻撃が短時間かつ低コストで仕掛けられる可能性にあると指摘している。

　「現在、多くのサイバーセキュリティ防御は人間のオペレーターに依存しており、それが機械の処理速度に対応した防御へとスケールアップできるかどうかは不明だ。現在、私たちは自律的な攻撃やLLMを使った自立型防御について研究を進めている」（シンガー氏）

（注1）Carnegie Mellon Researchers Demonstrate That LLMs Can Autonomously Plan and Execute Real-World Cyberattacks（businesswire）
（注2）Equifax breach: What you need to know（CIO Dive）
（注3）When LLMs autonomously attack（Carnegie Mellon University）
（注4）LLMs with cyber toolkits can conduct multistage cyber operations on business-sized computer networks（red.anthropic.com）
（注5）Colonial CEO says ransomware hackers exploited legacy VPN（Cybersecurity Dive）

原文へのリンク

生成AIがついに実戦投入　革新的なマルウェア「LAMEHUG」のヤバイ手口
サイバー攻撃の実行フェーズで生成AIを直接利用する事例がついに見つかった。新型マルウェア「LAMEHUG」は一体どのように生成AIを悪用するのか。その手法と攻撃者の狙いに迫る。
Excelの外部リンク無効化へ　Microsoftがセキュリティ強化に向けた新方針
Microsoftは2025年10月から、Excelにおいてブロック対象のファイル形式への外部リンクをデフォルトで無効化する仕様を段階的に導入する。業務フローへの影響を避けるため早期の対応が推奨されている。
EDR無効化ツールがランサムグループ間で大流行　複数ベンダーの製品が標的か
SophosはEDR無効化ツールの分析結果を公表し、複数のランサムウェア攻撃において、難読化や偽装ドライバーを使った検出回避の手法が確認された。脅威グループ間での技術共有の兆候があり、攻撃のエコシステム化が進んでいる。
8万4000通のメールを分析して判明した“高品質”なフィッシングの条件とは？
高度なフィッシングメールには人間心理の隙を巧妙に突いた文面が採用されています。本稿は8万4000通を分析して判明した“高品質”なフィッシングメールの条件と、これに対抗するための心理的アプローチを組み込んだ4つの防御策を紹介します。