「Claude Opus 4.5」公開　コーディングとエージェント機能で“世界最高峰”：AIニュースピックアップ

AnthropicからClaude Opus 4.5が公開された。Claude Sonnet 4.5の性能を全体的に強化したモデルとなっており、特にコーディングとエージェント機能において高性能を示している。

LINE

Hatena

　Anthropicは2025年11月25日（現地時間）、「Claude Opus 4.5」（以下、Opus 4.5）を発表した。同モデルは「コーディング、エージェント、そしてコンピュータ活用において世界最高峰のモデル」とされている。

　発表と同時に「Claude」アプリやAPI、Amazon Web Services（AWS）、Microsoft Azure、Google Cloudで利用できる。API経由で利用する場合、料金は100万トークン当たり入力は5ドル、出力は25ドルとなっている。

「多くの分野で最先端」の性能

Opus 4.5の主要なベンチマークスコアは以下の通りだ。

Claude Opus 4.5の主要ベンチマークスコア（出典：AnthropicのWebサイト）

　同モデルは実務的なソフトウェア開発試験で高い成果を示し、人間の技術者が挑む高難度試験においても優れた結果を残した。試験は短時間での判断力を測る内容であり、複雑な仕様理解や修正方針の組み立てを求める構成となっている。Opus 4.5はこの条件下で素早く核心に近づき、根拠を伴う回答を提示した。

　コード生成以外の分野でも性能向上が見られた。画像理解や推論、数値処理などの領域で前世代（Opus 4.1やSonnet 4.5）を上回り、エージェンティックなツール使用やPC操作などで高い性能を示した。特に複合的な内容の依頼に対して、許容範囲内で別解を導出するなど柔軟性が高いという。

　一方で、科学的な知識や、大学レベルの他分野マルチモーダル性能、多言語性能においてはOpenAIの「GPT-5.1」やGoogleの「Gemini 3 Pro」と同等か、それらより少し低い性能となっている。用途に応じたモデルの使い分けが広がりそうだ。

　安全性面でも大幅な改良が施されている。悪意のある誘導によって方針が乱れる事態を防ぐため、強固な防御設定と厳密な検証手続きを取り入れた。攻撃的な入力を混在させる試験で他社製を含む多数のモデルより耐性が高い結果となったという。

　開発者向けプラットフォームにおいては、「effort」パラメータを調整することで、少ない計算量で早期解決を狙う設定と、より高性能を求める設定を切り替えられるようになった。長時間作業や多数の補助エージェントを連携させる構成の安定性も向上したという。

Microsoft 365 Copilot、ついに“エージェント化”　ExcelやWordで複雑なタスクを段階的に処理する新機能
Microsoftは、Microsoft 365 Copilotの新機能「Agent Mode」と「Office Agent」を発表した。ExcelやWordなどのOfficeアプリでAIと対話的に協働し、複雑な業務を段階的に処理・完成できる。
“AIエージェントの次”のトレンドは何か　Gartnerが描く未来志向型インフラのハイプ・サイクル
Gartnerは、日本の未来志向型インフラ・テクノロジーに関するハイプ・サイクルを発表した。AIエージェントや完全自動化など9項目を新たに加え、2030年を目標とした産業変革の指針を提示している。
生成AI、進化の鍵を握る「長期思考」　Sakana AIが挑む“人間のように試行錯誤するAI”への道筋
AIの進化は目覚ましく、その活用は日々広がっている。しかし、現在のAIにはまだ苦手な分野がある。それは数週間といった「長期間の思考」を要する複雑なタスクだ。この難題にAI研究の最前線はどう挑んでいるのか。Sakana AIの秋葉拓哉氏に話を聞いた。