Anthropic、Claude Opus 4.8を一般提供 誠実さが飛躍的に向上、Mythosに並ぶアライメント性能を実現
米Anthropicは5月28日(現地時間)、AIモデルの最新版「Claude Opus 4.8」の一般提供を開始した。前世代の「Opus 4.7」から推論、コーディング、エージェント能力などほぼすべての評価指標でパフォーマンスを向上させた。特に、判断の精度が向上し、自らの作業の進捗や不確実性に対してより誠実になったほか、コンテキストを維持しながら自律的に長く独立して作業する能力が改善されているという。
飛躍的に向上したモデルの「誠実さ」
Opus 4.8の最も顕著な改善点の1つは、自らの作業の進捗や不確実性に対する誠実さ(Honesty)の向上だ。AIモデルが薄弱な根拠で作業が進んだと過信して主張してしまう問題が改善され、Opus 4.8は自身が書いたコードの欠陥を見逃す可能性が前世代の約4分の1に減少しているという。また、エージェントによるコーディングセッションで自身の作業を要約するテストでは、未実装の機能やテストの失敗などの問題をユーザーに報告しそびれる割合が3.7%へと大幅に低下した。さらに、欠陥のあるデータを無批判にそのまま報告してしまうテストや、コードベースの調査で確認を怠る「怠惰な調査」のテストで、Claudeモデルとして初めて完璧なスコア(不正解率0%)を達成した。加えて、未知のツールに関する質問に対しても、自信過剰に間違った回答をする割合がOpus 4.7から10分の1以下へと劇的に減少しており、自律的な作業を安心して任せられる信頼性の高さが実証されたとしている。
大規模タスクを自律処理する「dynamic workflows」
新機能として、Claude Code上で「dynamic workflows」の研究プレビューを導入した。これは、Claudeが自ら計画を立てて数十から数百のサブエージェントを1つのセッション内で並行して走らせる機能で、結果を検証した上でユーザーに報告する。これにより、数十万行に及ぶコードベース全体の移行や広範なバグ探しなど、これまで数週間を要していた大規模なエンジニアリング作業を数日で完了させることができるとしている。この機能は、Max、Team、Enterpriseプランに加え、API、Amazon Bedrock、Vertex AI、Microsoft Foundryなどでも利用可能だ。
「Mythos」との関連
Anthropicは、「Claude Mythos Preview」をサイバーセキュリティ分野の限られた組織向けに提供しているより高い能力を持つモデルとして位置づけている。Opus 4.8は全体的な能力やサイバーセキュリティ関連の能力ではMythosを超えるものではないが、人間の価値観との整合性(アライメント)という観点ではMythosと同等のプロファイルを示しているという。
Anthropicは、今後数週間以内にMythosクラスのモデルに、より強力な安全策を講じた上で、一般向けにリリースする計画も明らかにした。
システムカードで指摘されている懸念点
性能向上の一方で、同時公開されたシステムカードでは、安全上の懸念も報告されている。特にトレーニング過程でモデルが「評価者(グレーダー)が何を求めているか」を推測しようとする傾向が確認された。これは、タスクの実際の成功よりも「成功しているように見せること」を優先する可能性を示唆しており、現在の展開環境で悪影響は出ていないものの、今後の訓練を複雑にする可能性があるとしている。また、極端な悪用リクエストに対する協力やプロンプトインジェクションへの脆弱性も一部残存しており、これらはモデル外部のガードレールによって引き続き対策しているという。
価格と利用方法
Opus 4.8はAPIやclaude.aiを通じて即日利用可能で、価格はOpus 4.7から据え置かれている(100万入力トークン当たり5ドル、100万出力トークン当たり25ドル)。また、2.5倍の速度でモデルを動作させる「Fast mode」は以前より3分の1の価格に値下げされ、100万入力トークン当たり10ドル、100万出力トークン当たり50ドルとなった。さらにclaude.aiなどの環境では、ユーザーがモデルの思考量(Effort)を制御できる新機能が追加され、応答の速度と精度のバランスを選択できるようになっている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
NEC、日立、富士通が“Anthropic協業”でそろい踏み 狙いは? 【3社の幹部コメントまとめ】
-
2
「残高教えて」ChatGPTに話しかけるだけ マネーツリー、「Apps in ChatGPT」対応
-
3
「国会議員マップ」話題 建設職人が個人で開発、議員の発言や政治の動きを分かりやすく 生成AI活用
-
4
「AIに任せ過ぎて本番データ消失」 活用率98%のGMOが導き出した、生成AIを使いこなせる人の5つの特徴
-
5
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
-
6
OpenAI、Anthropicが新会社設立 国内SIerは「黒船襲来」に対抗できるか?
-
7
レノボ、国内に“水冷AIインフラ”の検証施設 GPUサーバ需要増で水冷活用促す
-
8
「控えめに言って100兆円」巨大フィジカルAI市場、日本の勝ち筋は 日立がAnthropicとの提携で示した戦略
-
9
「Google AI Pro」ユーザーはYouTube広告ほぼ非表示 「Premium Lite」無料付与
-
10
Docker専用のAIエージェント「Gordon」が正式リリース 無料アカウントでも利用可能
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR