「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
米Anthropicは6月12日、最上位AIモデル「Claude Fable 5」「Claude Mythos 5」の提供を全ユーザーで停止すると発表した。米政府が安全保障を理由に、外国籍者のアクセス全面停止を命じる輸出規制指令を出したため。同社は指令に従う一方「誤解だ」として早期の復旧を目指すとしている。他のモデルへの影響はない。
米Anthropicは6月12日(現地時間)、最上位AIモデル「Claude Mythos 5」と、Mythos 5に保護機能を実装した「Claude Fable 5」の提供を全ユーザーで停止すると発表した。米政府が安全保障上の権限に基づき、外国籍者による両モデルへのアクセスを全て停止するよう求める輸出規制指令を出したため。他のモデルは影響を受けないとしている。
同社によると、指令は同日午後5時21分(米東部時間)に書簡で届いた。米国内外を問わず、同社の外国籍従業員を含む全ての外国籍者のアクセス停止を求める内容で、順守するには両モデルを直ちに無効化するしかなく、結果として全顧客が利用できなくなったと説明している。
政府はFable 5の保護機能を回避する「ジェイルブレーク」(脱獄)の手法を把握したという。Anthropicが指令の根拠とみられる報告を検証した結果、見つかるのは少数の既知の軽微な脆弱性にとどまり、同等の能力は米OpenAIの「GPT-5.5」など他の公開モデルでも広く得られると主張している。
また同社は、公開前の数週間に米政府や英国のAI評価機関(UK AISI)、複数の民間第三者機関などと協力し、計数千時間に及ぶ保護機能の検証(レッドチーム演習)を実施したと説明。保護機能を広範に無効化できる「ユニバーサルジェイルブレーク」を発見できたテスターはおらず、特定の状況でのみ通用する限定的な回避が残り得ることは公開時に明言済みだったとしている。
そのうえで同社は、指令に従って両モデルへのアクセスを遮断する一方、「限定的な潜在的ジェイルブレークの発見が、数億人に展開された商用モデルを回収する理由になるべきだという考えには同意しない。この基準が業界全体に適用されれば、全てのフロンティアモデル提供者による新たなモデルの展開は事実上止まる」と反論。「これは誤解だと考えており、可能な限り早くアクセスを復旧するよう取り組んでいる」とし、24時間以内に詳細を公表するという。
一方、米メディアのAxiosによると、指令はハワード・ラトニック商務長官がダリオ・アモデイCEOに宛てた書簡として送られた。政権当局者は同メディアに対し、別の企業がMythosのジェイルブレークに成功したと主張したことを受けた措置だと説明。政権はAnthropicに新モデルの公開延期を求めたが実現しなかったといい、米政府の安全保障体制が強化されるまでモデルの停止が必要で、体制の強化は数週間以内に実現する可能性があると述べたという。
Fable 5は10日に一般公開されたばかりで、3日での全面停止となる。なお、編集部で確認した限り、執筆時点(13日午前10時50分)ではFable 5へのアクセスは可能となっている。どのタイミングで利用不可となるかは現時点では不明だ。
Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。
関連記事
Anthropic、ミュトス級AI「Claude Fable 5」を一般公開 保護機能解除版「Mythos 5」も限定提供
Anthropicは、新AIモデル「Claude Fable 5」を一般公開した。同社の最上位「Mythosクラス」に属し、これまで一般提供を見送ってきた水準の能力を、悪用を防ぐ保護機能とともに全ユーザーへ開放した。同時に、サイバー関連の保護機能を解除した上位版「Claude Mythos 5」を信頼できるパートナー向けに限定提供する。画像認識だけで「ポケモン ファイアレッド」をクリアするなどビジョン性能の大幅向上もアピールした。
Fable 5、ガードレール(保護機能)が厳しすぎて「DNAとは?」にも答えず
Anthropicが一般公開した最上位AIモデル「Claude Fable 5」の保護機能が、無害なリクエストまで弾くとしてXなどで批判を集めている。Fable 5はサイバーセキュリティや生物・化学などに関する質問を検知すると、応答を下位の「Claude Opus 4.8」に切り替える。
Anthropic、「Fable 5」のガードレールの仕組みを説明 課金の仕組みや設定変更方法など
Anthropicは、新AIモデル「Claude Fable 5」の過剰なブロックに対する挙動や管理方法を説明するヘルプ記事を公開した。セキュリティや生物学に関する質問を検知すると下位モデルへ自動で切り替わる機能の仕様、料金体系、設定オフの手順を明示。今後は誤検知を減らし、正当な研究や防衛作業の支援を目指す。
Anthropic、「Fable 5」の不可視だった蒸留の保護機能を可視化 「誤った判断」と謝罪
Anthropicは、AIモデル「Claude Fable 5」の特定の保護機能がユーザーに不透明な形で動作していたことを「誤った判断」と認め、謝罪した。モデルの蒸留に関する制限を検知した際、これまでは不可視のまま下位モデルへ切り替えていたが、今後は明示的な仕様に変更する。誤検知への対応と分類器の調整も進める。
