Anthropic、「Claude」が中国政府系攻撃者に悪用されたと報告
Anthropicは、中国政府支援の攻撃者が「Claude」を悪用し、約30件の攻撃を自動化したと発表した。9月に検知したもので、人間の介入が少ない初の事例だとしている。攻撃者はAIを欺き、偵察や悪用等の8〜9割を実行させた。Anthropicは対策を強化し、AIの防御利用も推奨した。
米Anthropicは11月13日(現地時間)、中国政府が支援する攻撃者グループが、同社のAIモデル「Claude」を悪用して企業や政府に対するおよそ30件の攻撃を自動化したと発表した。このスパイ活動は9月中旬に検知され、Anthropicはその後の10日間で調査を進め、作戦の全容を把握したとしている。
Anthropicは、これが大規模なサイバー攻撃が実質的な人間の介入なしに実行された初めての文書化された事例であるとしている。このキャンペーンは、8月に報告した「バイブハッキング」の発見からさらにエスカレーションしているという。バイブハッキングでは人間がループ内に留まって作戦を指揮していたのに対し、今回の攻撃では規模が拡大したにもかかわらず、人間の関与ははるかに少なかった。
「GTG-1002」と指定されたこの中国政府支援グループは、AIのエージェント的能力を前例のないレベルで利用し、AIを単なるアドバイザーとしてではなく、サイバー攻撃を実行するために使用した。
Claudeは本来、有害な行動を避けるように訓練されている。攻撃者は、Claudeを攻撃に参加させるためにジェイルブレイクする必要があった。その方法は、一見無害に見える小さなタスクに分解し、またClaudeに対し、正当なサイバーセキュリティ企業の従業員として防御テストに使用されていると伝えることで、そのガードレールを欺くというものだ。このフレームワークは、「Claude Code」を自動化されたツールとして使用し、偵察、脆弱性の発見、悪用、認証情報の窃取、データ分析、およびデータ持ち出しの戦術的な作業の約80〜90%を自律的に実行した。
この作戦は、大手のテクノロジー企業、金融機関、化学製造会社、政府機関など、世界中の約30のターゲットを標的にしており、少数の成功した侵入が確認されている。特に、主要なテクノロジー企業や政府機関を含む、確認された高価値のターゲットへのアクセスに成功したという。ただし、AIは時折、機能しない認証情報を捏造したり、公開されている情報を秘密情報であると主張したりする幻覚(ハルシネーション)を起こすことで、完全自律型サイバー攻撃の障害となっていた。
Anthropicは、この活動を検出すると直ちに調査を開始し、悪用されたアカウントを停止し、影響を受けたエンティティに適切に通知し、実行可能な知見を収集しながら当局と連携した。
今後の対策として、Anthropicは検出能力を拡大し、悪意のある活動をフラグ付けするためのサイバー攻撃に特化した分類器を開発した。また、自律的なサイバー攻撃に対するプロアクティブな早期検出システムのプロトタイプ開発や、大規模で分散型の攻撃を調査および軽減するための新しい技術を開発している。
Anthropicは、この技術が防御にとっても重要であるとし、企業に対し、セキュリティオペレーションセンター(SOC)の自動化、脅威検出、脆弱性評価、インシデント対応などの分野でAIを防衛に応用することを推奨している。さらに、敵対的な悪用を防ぐために、AIプラットフォーム全体でセーフガードへの継続的な投資が必要であるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
ランサムウェア攻撃増加の一因? AIを使った「バイブハッキング」とは何か、その手法を紹介
日本企業に対する、大規模なランサムウェア攻撃が相次いでいる。こうした攻撃増加の一因とみられる「バイブハッキング」とは何か、その手法を紹介する。
詐欺師の次のターゲットはAI──「AIエージェントブラウザ」に潜む危険 複雑化する詐欺への対策は
Web閲覧やWebサービス利用を効率化してくれるテクノロジーとして、進化と普及が期待されている「AIエージェントブラウザ」がある。人間の業務を代行する機能を備える一方、単純な詐欺への脆弱性があるという指摘もある。
Anthropic、AI「Claude」に“核兵器への悪用”を防ぐシステム実装
Anthropicが米政府機関と協力し、AIの核兵器開発への悪用を防ぐシステムを開発した。「Claude」に実装済みのこの分類器は96%の精度で危険な対話を検知する。成果は他分野への応用も視野に業界で共有する予定だ。
Anthropic、「Claude」の使用ポリシーを更新 エージェント機能の悪用規制を明示
Anthropicは、AI「Claude」の使用ポリシーを9月15日付で更新すると発表した。エージェント機能の進化を受け、マルウェア作成やサイバー攻撃などの悪用を具体的に禁止。一方、政治的コンテンツに関する制限は一部緩和する。

