検索
ニュース

「Claude Opus 4.5」公開 コーディングとエージェント機能で“世界最高峰”AIニュースピックアップ

AnthropicからClaude Opus 4.5が公開された。Claude Sonnet 4.5の性能を全体的に強化したモデルとなっており、特にコーディングとエージェント機能において高性能を示している。

Share
Tweet
LINE
Hatena

 Anthropicは2025年11月25日(現地時間)、「Claude Opus 4.5」(以下、Opus 4.5)を発表した。同モデルは「コーディング、エージェント、そしてコンピュータ活用において世界最高峰のモデル」とされている。

 発表と同時に「Claude」アプリやAPI、Amazon Web Services(AWS)、Microsoft Azure、Google Cloudで利用できる。API経由で利用する場合、料金は100万トークン当たり入力は5ドル、出力は25ドルとなっている。

「多くの分野で最先端」の性能

Opus 4.5の主要なベンチマークスコアは以下の通りだ。


Claude Opus 4.5の主要ベンチマークスコア(出典:AnthropicのWebサイト)

 同モデルは実務的なソフトウェア開発試験で高い成果を示し、人間の技術者が挑む高難度試験においても優れた結果を残した。試験は短時間での判断力を測る内容であり、複雑な仕様理解や修正方針の組み立てを求める構成となっている。Opus 4.5はこの条件下で素早く核心に近づき、根拠を伴う回答を提示した。

 コード生成以外の分野でも性能向上が見られた。画像理解や推論、数値処理などの領域で前世代(Opus 4.1やSonnet 4.5)を上回り、エージェンティックなツール使用やPC操作などで高い性能を示した。特に複合的な内容の依頼に対して、許容範囲内で別解を導出するなど柔軟性が高いという。

 一方で、科学的な知識や、大学レベルの他分野マルチモーダル性能、多言語性能においてはOpenAIの「GPT-5.1」やGoogleの「Gemini 3 Pro」と同等か、それらより少し低い性能となっている。用途に応じたモデルの使い分けが広がりそうだ。

 安全性面でも大幅な改良が施されている。悪意のある誘導によって方針が乱れる事態を防ぐため、強固な防御設定と厳密な検証手続きを取り入れた。攻撃的な入力を混在させる試験で他社製を含む多数のモデルより耐性が高い結果となったという。

 開発者向けプラットフォームにおいては、「effort」パラメータを調整することで、少ない計算量で早期解決を狙う設定と、より高性能を求める設定を切り替えられるようになった。長時間作業や多数の補助エージェントを連携させる構成の安定性も向上したという。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る