米Anthropicは6月9日(現地時間)、新たなAIモデル「Claude Fable 5」を一般公開した。同社の最上位「Mythosクラス」に位置付けられ、これまで一般提供を見送ってきた水準の能力を、悪用防止用のセーフガードとともに全ユーザーへ初めて開放した形だ。
同時に、サイバー関連の保護機能を解除した上位構成「Claude Mythos 5」を、信頼できるパートナー向けに限定提供する。
両モデルはAPIモデル名「claude-fable-5」などで提供され、価格は入力100万トークン当たり10ドル、出力100万トークン当たり50ドル。
「Fable」はラテン語の「fabula」(語られるもの)に由来し、ギリシャ語の「mythos」と類義の関係にある。両モデルは同一の基盤モデルで保護機能の有無のみが違うため、意味の近い別言語の語を当てて区別したという。
Fable 5は同日から、無料を含むすべての「Claude」プランで利用可能になった。Pro/Max/Team/シート課金型Enterpriseのサブスクリプションプランでは6月22日まで追加費用なしで使えるが、6月23日以降は利用クレジットが必要となる。需要が読みにくいための段階的提供で、提供能力が整い次第、標準機能として組み込む方針という。
APIおよび従量課金型Enterpriseでは初日から全面提供される。一方のMythos 5は当面、サイバー防衛関連の取り組み「Project Glasswing」のパートナーに限られ、米政府と連携する「信頼アクセスプログラム」を通じて段階的に対象を広げる。生命科学分野の研究者向けにも、生物・化学の保護機能を解除したMythosクラスの提供枠を別途設ける。
Anthropicは、Fable 5の画像認識能力が大幅に向上したことを強調している。デモとして、ゲーム画面のスクリーンショットだけを頼りに「ポケットモンスター ファイアレッド」を最初から最後までクリアする動画を公開した。地図やナビゲーション補助、ゲーム内部の状態情報などは一切与えていない。従来モデルでは補助ツール群を組み合わせてもクリアが難しかったタスクを、Fable 5は画像認識のみで完走したという。
Anthropicが公開したシステムカードによると、Fable 5の保護機能はサイバーセキュリティ、生物・化学、モデルの「蒸留」に関する用途に加え、フロンティアLLM開発を支援する用途にも適用される。前者3分野ではユーザーに通知の上で「Claude Opus 4.8」へ自動的に切り替わるが、フロンティアLLM開発の用途に関する制限はユーザーに見えない形で行われ、別モデルへの切り替えも起こらない。プロンプト修正や微調整によってモデルの有効性を限定する仕組みで、影響を受けるトラフィックは全体の約0.03%、組織数では0.1%未満と見積もる。
また、保護機能が作動した際の挙動は利用環境ごとに異なる。Webやデスクトップ、モバイルアプリでは自動的にOpus 4.8へフォールバックしてユーザーに通知が出るが、Messages APIでは既定では自動フォールバックがなく、拒否理由付きで応答がブロックされる。開発者側で再試行やフォールバック処理を実装するか、サーバ側自動フォールバックをオプトインで有効化する必要がある。
同社はこのほか、安全性評価でMythos 5のアライメントはOpus 4.8と概ね同等とした上で、自殺や自傷に関するユーザーとの対話で一部の応答に後退が見られたこと、子どもの安全に関する一部領域で改善余地があることを明らかにした。いずれも「claude.ai」のシステムプロンプト更新でおおむね対応済みとし、今後のモデル学習にも反映するとしている。
日本政府、AI「Mythos」アクセス権を取得 サイバー防衛強化に活用
Anthropic、650億ドル調達──評価額は3カ月で2.5倍の9650億ドルとなりOpenAIを上回る
Anthropicが上場申請
Claude Mythosがもたらすセキュリティビジネス激変の可能性 二極化していく“業界のこれから”Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR