「Claude Opus 4」「Claude Sonnet 4」発表　ソフトウェア開発などで「o3」超えうたう【更新終了】

» 2025年05月23日 01時36分公開

[ITmedia]

　米Anthropicは5月22日（現地時間）に開催した開発者向けイベント「Code with Claude」で、最新AIモデル「Claude Opus 4」「Claude Sonnet 4」を発表した。いずれもソフトウェア開発などの分野で米OpenAIの「o3」を超える性能という。

発表の様子

　どちらのモデルも応答速度に長けたモードと、長考によって高いクオリティーの回答を出す「拡張思考」モードを使い分け可能。拡張思考中に同社のWeb検索用APIを使い、回答に反映することもできるという。

　Opus 4は同社で「最も強力なモデル」をうたう。コーディングと複雑な問題解決に向くといい、ソフトウェア開発における現実的な課題に対する性能を測るベンチマーク「SWE-bench Verified」では72.5％（計測手法によっては79.4％）の正答率を記録。o3（69.1％）や米Googleの「Gemini 2.5 Pro Preview 05-06」（63.2％）を上回ったという。数時間にわたる連続動作も可能で、AIエージェントとしての利用にも向くとしている。

　Sonnet 4は、性能と実用性のバランスが取れたモデルをうたう。Anthropicは「ほとんどの領域でOpusには匹敵しない」としているが、SWE-bench Verifiedで72.7％（計測手法によっては80.2％）を記録するなど、いくつかの分野でOpus 4を超えるスコアを出している。

新モデルのベンチマーク（ニュースリリースから引用、以下同）

　モデルがタスクを処理する際に、作業をショートカットしてしまうリスクも抑えた。両モデルとも、前モデル「Claude 3.7 Sonnet」に比べ、同様の挙動を起こす確率が65％減ったという。これによりAIエージェントとしての利用もしやすくなったとしている。

　両モデルは同日から有料プランのユーザーに提供する。無料ユーザーにもSonnet 4を提供するが、拡張思考は利用できない。API料金はOpus 4が入力トークン100万個／15米ドル、出力トークン100万個／75米ドル。Sonnetは3米ドル／15米ドル。

AIは「ポケモン赤」をクリアできるのか？　Claude 3.7 Sonnetが“ゲーム実況”、開発元がプレイ動画を配信中
米Anthropicは、同社の最新AIモデル「Claude 3.7 Sonnet」がゲーム「ポケットモンスター赤」をプレイする配信を開始した。同AIモデルの性能を示すためのプロジェクトとみられる。
Anthropic、Web検索用API公開　Claudeをリアルタイムデータで強化可能に
Anthropicは「Anthropic API」にWeb検索機能を導入すると発表した。「Claude」がWeb上の最新情報にアクセスできるようになる。
「異議あり！」――AIが「逆転裁判」をプレイ　最も“推論性能”が高いモデルは？　米大学が実験
ゲーム「逆転裁判」をAIにプレイさせ、推論性能を測る――米カリフォルニア大学サンディエゴ校の研究機関・Hao AI Labは4月16日、こんな実験の結果を公開した。
「Claude」のAnthropic、35億ドル調達　評価額は615億ドル
AI「Claude」を手掛けるAnthropicはシリーズEラウンドで、35億ドル調達した。資金調達後の評価額は615億ドルとなった。
学生必見、AIエディタ「Cursor」のProプランが1年無料に　課金済みでも未使用分を返金
AIエディタ「Cursor」を開発する米Anysphereは、同エディタの有料プラン「Pro」を学生向けに無料で提供開始した。