復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
米AnthropicのAIモデル「Claude Fable 5」が世界的にサービスを再開した。Anthropicは復活に向けてどういった経緯と対策を行ったのか、モデル再開にあわせて詳細を公開した。
全世界で再び利用できるようになった、米Anthropicの生成AIモデル「Claude Fable 5」。一部制限を緩和した特定ユーザー向けの「Claude Mythos 5」とともに復活を果たしたが、どういった経緯と対策を行ったのか。Anthropicがモデル再開にあわせて詳細を公開した。
Fableは現在、有料プランのPro、Max、Team、一部のEnterpriseで利用できる。サブスクリプション内で利用できるのは7月7日まで(ただし週間利用枠の50%まで)。それ以降は従量課金に移る。
停止の経緯と復活までの道のり
今回の規制のきっかけは、一部で報道された通りAmazonのセキュリティチームがFable 5の安全対策をすり抜け、ソフトウェアの脆弱性を特定させる手口を米政府に報告したことだった。Fable 5にはもともと、危険なやり取りを検知して止める「分類器」と呼ぶ仕組みを軸にした多層的な安全対策を施していたが、Amazonの指摘でこれをすり抜けられる手口「ジェイルブレイク」の存在が判明した。
報告を把握した米政府は6月12日、安全保障上の懸念から輸出規制を指令。外国籍の利用者を対象から外す内容だったが、規制は即時発効で、Anthropicには国籍をその時点で確認する手段がなかったため、全ユーザーの利用停止を実施した。
ただ、Anthropicはこの手口で得られた脆弱性の検知性能自体については、「Mythosレベルの独自のサイバー能力を露呈するものではなかった」としており、同社のテストでは、Opus 4.8や「GPT-5.5」、「Kimi K2.7」でも、Fable 5がレポートで特定したものと同じ脆弱性を特定できたとしている。
それでも全停止が続く中、同社は復旧に向けて米政府と協調する道を選択。報告を受けた手口を検知して止められるよう改良版の分類器を開発した。同じ手口に該当するリクエストは、Opus 4.8に自動で切り替わるようになっている。同社によると、新しい分類器で問題の手口の99%以上を止められるようになった一方、通常のプログラミング作業でも無害なリクエストを誤って止める頻度は増えると認めており、今後精度を改善していくとしている。
こうした対策の根幹が、分類器の判定ラインを拡大する「安全マージン」だ。分類器は完璧ではなく、危険な指示を見逃すこともある。Anthropicは、明確に安全な依頼だけを通し、少しでも危険の可能性があれば止める設計を採用しているが、Fable 5ではこのマージンを従来より広げ、無害な依頼まで止まる頻度が増える代わりに、モデルを安全に広く提供できるようにした。
こうした安全策の結果、米商務省傘下のAIセキュリティ標準・革新センター(CAISI)の研究者が、従来の対策と今回の新たな対策の両方を検証した結果、新方式を「極めて強固」と評価したという。
今後の施策と米政府との連携
またAnthropicは今回、AIが安全対策を回避するジェイルブレイクの深刻度を客観的に評価する共通基準が存在しないことを指摘した。同社はAmazon、Microsoft、Googleなど「Glasswing」の各パートナーとともに、ジェイルブレイクを「脱獄でどれだけ能力が上がるか」「悪用できる攻撃対象がどこまで広いか」「攻撃への転用にどれだけ手間がかかるか」「その手口がどれだけ入手しやすいか」の4つの観点で評価。重要インフラや金融システムへ影響するような深刻な攻撃は、確認次第すぐに暫定対策を展開するとした。
あわせて、報告を24時間態勢で監視する専門チームを新設し、研究者がFable 5の弱点を報告できる窓口「HackerOne」プログラムも開設する。
米政府との連携もさらに強める。6月2日に政府が発令した「先端AIに関する大統領令」を踏まえた取り組みで、安全保障上重要なモデルについて政府機関へ事前のアクセスと評価の機会を提供すること、重大なジェイルブレイクや悪用パターンを早期に共有すること、政府との共同研究に専任チームと計算資源を投じること、業界共通のセキュリティ管理と評価基準づくりに協力すること――これら4つの取り組みを進めるとした。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「Claude Fable 5」が帰ってくる 「Mythos 5」含む輸出規制解除へ Anthropic発表
Anthropicは6月30日(現地時間)、「Claude Fable 5」「Mythos 5」への輸出規制が解除されたと明らかにした。7月1日からアクセスを回復し、詳細は近日中に発表するとしている。
Anthropic、「Claude Sonnet 5」公開──停止中のミュトスとは別にOpus級の性能を低価格で
Anthropicは、最新AIモデル「Claude Sonnet 5」を発表した。全プランで利用可能になっている。日常業務やコーディングのエージェント機能が大幅に強化され、最上位クラスのOpus 4.8に迫る性能を低価格で実現している。
米政府、Anthropicの「Mythos」(ミュトス)再開を一部容認──「Fable 5」は停止継続
Anthropicは、輸出規制で6月12日から全面停止していたAIモデル「Claude Mythos 5」について、一部の米国組織への再展開を米政府が認めたと発表した。一方、「Claude Fable 5」は引き続き停止されたままで、一般提供の再開に向けた協議が続いている。
「Fable 5」停止から2日、MicrosoftのナデラCEOがXに「エコシステムなきフロンティアは不安定」と投稿
Anthropicの「Claude Fable 5」が米政府の輸出管理指令により全世界で停止されてから2日後、MicrosoftのナデラCEOがXに「エコシステムなきフロンティアは不安定」と題した論考を投稿した。Fable 5には直接言及せず、企業が特定モデルに依存せず自社の「学習ループ」を構築することの重要性を訴えた。
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
米Anthropicは6月12日、最上位AIモデル「Claude Fable 5」「Claude Mythos 5」の提供を全ユーザーで停止すると発表した。米政府が安全保障を理由に、外国籍者のアクセス全面停止を命じる輸出規制指令を出したため。同社は指令に従う一方「誤解だ」として早期の復旧を目指すとしている。他のモデルへの影響はない。

