ITmedia AI＋
生成AI
Anthropic、Claude Opus 4.8を一般提供　誠実さが飛躍的に向上、Mythosに並ぶアライメント性能を実現

Anthropic、Claude Opus 4.8を一般提供　誠実さが飛躍的に向上、Mythosに並ぶアライメント性能を実現

公開 2026年05月29日 06時42分

更新 2026年05月29日 10時16分

[ITmedia]

印刷する

　米Anthropicは5月28日（現地時間）、AIモデルの最新版「Claude Opus 4.8」の一般提供を開始した。前世代の「Opus 4.7」から推論、コーディング、エージェント能力などほぼすべての評価指標でパフォーマンスを向上させた。特に、判断の精度が向上し、自らの作業の進捗や不確実性に対してより誠実になったほか、コンテキストを維持しながら自律的に長く独立して作業する能力が改善されているという。

Claude Opus 4.8、Opus 4.7、GPT-5.5、Gemini 3.1 Proの性能比較一覧（出典：Anthropic、以下同）

飛躍的に向上したモデルの「誠実さ」

　Opus 4.8の最も顕著な改善点の1つは、自らの作業の進捗や不確実性に対する誠実さ（Honesty）の向上だ。AIモデルが薄弱な根拠で作業が進んだと過信して主張してしまう問題が改善され、Opus 4.8は自身が書いたコードの欠陥を見逃す可能性が前世代の約4分の1に減少しているという。また、エージェントによるコーディングセッションで自身の作業を要約するテストでは、未実装の機能やテストの失敗などの問題をユーザーに報告しそびれる割合が3.7％へと大幅に低下した。さらに、欠陥のあるデータを無批判にそのまま報告してしまうテストや、コードベースの調査で確認を怠る「怠惰な調査」のテストで、Claudeモデルとして初めて完璧なスコア（不正解率0％）を達成した。加えて、未知のツールに関する質問に対しても、自信過剰に間違った回答をする割合がOpus 4.7から10分の1以下へと劇的に減少しており、自律的な作業を安心して任せられる信頼性の高さが実証されたとしている。

大規模タスクを自律処理する「dynamic workflows」

　新機能として、Claude Code上で「dynamic workflows」の研究プレビューを導入した。これは、Claudeが自ら計画を立てて数十から数百のサブエージェントを1つのセッション内で並行して走らせる機能で、結果を検証した上でユーザーに報告する。これにより、数十万行に及ぶコードベース全体の移行や広範なバグ探しなど、これまで数週間を要していた大規模なエンジニアリング作業を数日で完了させることができるとしている。この機能は、Max、Team、Enterpriseプランに加え、API、Amazon Bedrock、Vertex AI、Microsoft Foundryなどでも利用可能だ。

複数のサブエージェントがコード移行タスクを分担、実行するdynamic workflows

「Mythos」との関連

　Anthropicは、「Claude Mythos Preview」をサイバーセキュリティ分野の限られた組織向けに提供しているより高い能力を持つモデルとして位置づけている。Opus 4.8は全体的な能力やサイバーセキュリティ関連の能力ではMythosを超えるものではないが、人間の価値観との整合性（アライメント）という観点ではMythosと同等のプロファイルを示しているという。

Misaligned behavior（不適切な行動）のスコアでMythosと同等のプロファイルを示した

　Anthropicは、今後数週間以内にMythosクラスのモデルに、より強力な安全策を講じた上で、一般向けにリリースする計画も明らかにした。

システムカードで指摘されている懸念点

　性能向上の一方で、同時公開されたシステムカードでは、安全上の懸念も報告されている。特にトレーニング過程でモデルが「評価者（グレーダー）が何を求めているか」を推測しようとする傾向が確認された。これは、タスクの実際の成功よりも「成功しているように見せること」を優先する可能性を示唆しており、現在の展開環境で悪影響は出ていないものの、今後の訓練を複雑にする可能性があるとしている。また、極端な悪用リクエストに対する協力やプロンプトインジェクションへの脆弱性も一部残存しており、これらはモデル外部のガードレールによって引き続き対策しているという。

価格と利用方法

　Opus 4.8はAPIやclaude.aiを通じて即日利用可能で、価格はOpus 4.7から据え置かれている（100万入力トークン当たり5ドル、100万出力トークン当たり25ドル）。また、2.5倍の速度でモデルを動作させる「Fast mode」は以前より3分の1の価格に値下げされ、100万入力トークン当たり10ドル、100万出力トークン当たり50ドルとなった。さらにclaude.aiなどの環境では、ユーザーがモデルの思考量（Effort）を制御できる新機能が追加され、応答の速度と精度のバランスを選択できるようになっている。