Anthropic、最上位「ミュトス」級モデルを一般提供 悪用防ぐ保護機能を備えた「Claude Fable 5」

 米Anthropicは6月9日(現地時間)、新AIモデル「Claude Fable 5」の一般提供を始めた。同社がOpusクラスを上回る能力を持つと位置付ける最上位の「Mythos(ミュトス)クラス」に属するモデルで、これまでセキュリティ上の懸念から一般公開を見送ってきた水準の能力を、悪用を防ぐ保護機能(セーフガード)とともに初めて全ユーザーに開放した。同時に、保護機能の一部を解除した上位版「Claude Mythos 5」を、サイバー防衛などの信頼できる限られたパートナー向けに提供する。

Fable 5/Mythos 5と他社主要モデルの性能比較表(出典:Anthropic、以下同様)

封印されていた最上位モデルを一般解放

 Mythosは、同社のOpusシリーズのさらに上に位置する最上位のモデルだ。その第1弾「Claude Mythos Preview」は4月、世界の重要ソフトウェアの安全性を高める取り組み「Project Glasswing」を通じて、サイバー防衛者や重要インフラ事業者などごく限られた相手に提供されたが、ゼロデイ攻撃の自律開発も可能とされるほど高いサイバーセキュリティ能力ゆえに、一般公開は見送られていた。

 今回のFable 5は、その方針を転換し、Mythos級の能力を一般提供する初のモデルとなる。Anthropicは公開の前提として、悪用を確実に防げる強度の保護機能を新たに整備したと説明。数カ月かけて改良した結果、一般公開に十分な堅牢性に達したとしている。安全性を優先して保護機能を保守的に調整したため、無害なリクエストが誤って引っかかる場合もあるとし、今後の改良で誤検知を減らしていく方針だ。

 なお「Fable」はラテン語の「fabula(語られるもの)」に由来し、ギリシャ語の「mythos」と類義語関係にある。両モデルは同じ基盤モデルとしており、保護機能の有無が名称を分けている。

一部の用途は「Opus 4.8」へ自動フォールバック

 Fable 5の保護機能の中核となるのが、悪用の試みを検知する独立したAIシステム「分類器」だ。サイバーセキュリティ、生物・化学、そしてモデルの能力を抽出して競合モデルを学習させる「蒸留」に関連するリクエストを検知すると、本体のFable 5ではなく、次に高性能なモデル「Claude Opus 4.8」が応答を引き継ぐ。完全な拒否ではなく高性能モデルへの切り替えとすることで、利用体験の低下を抑える狙いがある。切り替えが発生した際はユーザーに通知される。

実際にFable 5に対し入力したところ、Opus 4.8へのフォールバックが起きた(撮影:編集部)

 同社によると、保護機能が作動するのは平均でセッション全体の5%未満で、95%超のセッションでは切り替えが起こらない。その場合のFable 5の性能は、保護機能を解除したMythos 5と実質的に同等という。

 保護機能の堅牢性については、外部のバグ報奨金プログラムで1000時間超の検証を行い、あらゆる場面で保護を無効化できる「ユニバーサル・ジェイルブレイク」は発見されなかったとする。外部のレッドチーム組織による長時間タスクの検証でも同様だが、英国の研究機関AI Security Instituteが短期間の初期検証でその手前まで到達したことには触れている。Anthropicは、ジェイルブレイクの完全な排除は不可能としつつ、実際に悪用される前に検知・防止できる程度に困難でコストの高いものにすることが目標とした。

性能は「一般提供してきたどのモデルも上回る」

 Anthropicは、Fable 5の能力がこれまで一般提供してきたどのモデルをも上回り、ソフトウェア開発、知識労働、画像認識、科学研究などほぼ全てのベンチマークで最高水準だと主張する。タスクが長く複雑になるほど、他モデルとの差は広がるという。

難解なコーディング課題を、高品質な本番レベルのソースコード基準を満たしながら解決できるか測る「FrontierCode」でFable 5がGPT-5.5を上回る

 ソフトウェア開発では、早期検証に参加した米Stripeが、5000万行規模のRubyコードベースで、チームが手作業なら2カ月以上を要する全体移行を1日で完了させたと報告。

 画像認識では、補助ツールを与えても従来モデルが苦戦していたゲーム「ポケットモンスター ファイアレッド」を、画面のスクリーンショットのみで最後までクリアしたとしている。

画像認識だけでFable 5は「ポケットモンスター ファイアレッド」をクリアした

 科学研究の用途では、保護機能を外したMythos 5を使い、タンパク質設計の一部工程を専門家比で約10倍に高速化。14の標的のうち9件で創薬候補が得られたほか、分子生物学では同社の科学者が約8割の比較でMythosの仮説をOpus級モデルより高く評価したという。

サイバー防衛者向け「Mythos 5」と信頼アクセスプログラム

 Mythos 5は、Fable 5と同一の基盤モデルからサイバー関連の保護機能を解除したもので、世界で最も強力なサイバーセキュリティ能力を持つとする。同日から、Project Glasswingの参加企業など既存のMythos Preview利用者がMythos 5へ移行できる。米政府と連携しながら、サイバーセキュリティ組織が体系的に申請できる「信頼アクセスプログラム」を通じて、提供先を段階的に拡大する計画だ。

 加えて、生物・化学の保護機能を解除しつつもサイバーの保護機能は維持したFable 5を、生命科学分野の少数の研究者に提供する信頼アクセスプログラムも開設する。創薬や新たな治療法の発見を加速させる狙いという。

価格と提供形態、データ保持ポリシーも変更

 Fable 5は同日から全世界で提供。APIのモデル名は「claude-fable-5」で、価格は入力100万トークン当たり10ドル、出力100万トークン当たり50ドルと、Mythos Previewの半額未満に設定された。Mythos 5は当面、Glasswingのパートナーおよび一部の生命科学研究者に限定される。

 需要が高く予測しにくいとして、サブスクリプションプランへの展開は段階的に行う。6月9日から6月22日まではPro/Max/Team/シート課金型Enterpriseの各プランで追加費用なしで利用できるが、6月23日以降は利用クレジットが必要になる。十分な提供能力が整い次第、標準機能として戻す方針だ。API版と従量課金型Enterpriseでは初日から全面提供される。

 このほか、Mythosクラスおよび今後の同等以上のモデルについては、ビジネス顧客のデータを30日間保持するポリシーへ変更する。データはモデルの学習や安全目的以外には使わず、複雑・新規の攻撃やジェイルブレイクへの防御、誤検知の低減に役立てるとしている。

印刷する
SNSでシェア

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR