Anthropic、「Claude Opus 4.5」リリース コーディング能力や会話継続能力が向上
Anthropicは、フラグシップAIモデル「Claude Opus 4.5」をリリースした。コーディングやエージェント機能を強化し、これまで数日かかっていた開発プロジェクトを数時間で完了させる能力を持つとしている。自動要約機能で「際限なくチャットを続けられる」ようになった。AWS、Google Cloud、Microsoftでも利用可能だ。
米Anthropicは11月25日(現地時間)、フラグシップAIモデルの最新版「Claude Opus 4.5」をリリースしたと発表した。「Opus」はClaudeの最大モデルだ。同社は9月に中型モデル「Sonnet」の、10月に最小モデル「Haiku」の4.5をリリース済みだ。
AnthropicはClaude Opus 4.5を、コーディング、エージェント、コンピュータの使用で世界最高のモデルで、同社がこれまでにリリースした中で最も高度なモデルと位置づけている。これまで数日かかっていた開発プロジェクトを数時間で完了させるコーディング能力や、曖昧な要求を処理し、複雑なマルチシステムバグの修正を自力で特定する能力を備えるという。
また、規制当局への提出書類や市場レポートを関連付ける金融分析、ログや脅威インテリジェンスを相関させるサイバーセキュリティのワークフローにも役立つとしている。
エージェント機能の強化として、プログラムによるツール呼び出しや、コンテキストウィンドウを圧迫せずに何百ものツールを動的に検索できるツール検索機能が開発者向けに導入された。従来モデルよりも少ないトークンでより良い結果を達成できるという効率性の向上も特徴の1つだ。
一般ユーザー向けアプリの改善点として、長いチャットが中断されることなく継続できるようになった。前モデルでは、チャットが非常に長くなると、一度に処理できる情報量の限界に達し、会話の内容を忘れ始めたり、一貫性が保てなくなったりする問題が発生していた。この問題を解決するために、必要に応じて以前の会話の内容を自動的に要約し、その要点を記憶に残す自動要約機能を組み込んだ。これにより、会話の重要な部分が常に最新の状態に保たれるため、「事実上、際限なくチャットを続けられるようになった」という。
また、「Claude Code」がデスクトップアプリでも利用可能になり、バグ修正やリサーチなどのタスクを複数のローカルおよびリモートセッションで並行して実行できるようになった。
安全性については、Anthropicがリリースした中で最も堅牢にアラインメントされたモデルだとしている。悪意のある攻撃に対する訓練や、プロンプトインジェクション攻撃に対するロバスト性が大幅に向上したため、業界の他のフロンティアモデルと比較してだましにくいとしている。
ベンチマーク結果としては、SWE-bench Verifiedで80.9%、Terminal-bench 2.0で59.3%を達成し、競合モデルを上回った。また、ARC-AGI-2 Verifiedでは37.6%、OSWorldでは66.3%を記録した。
新モデルは、Anthropicのアプリ、API、主要な企業向けクラウドサービス(Google Cloud、AWS、Microsoft)で利用可能だ。Google CloudのVertex AIで一般提供されるほか、MicrosoftのFoundry、GitHub Copilotの有料プラン、Microsoft Copilot Studio、AWSのAmazon Bedrockでパブリックプレビューとして提供が開始された。Microsoftでの価格は、100万トークン当たり入力が5ドル、出力は25ドルだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Anthropic、Claudeのカスタマイズ機能「Skills for Claude」リリース
Anthropicは、Claudeを特定タスクの専門家に変えるという新機能「Skills for Claude」をリリースした。指示やコードをまとめた「Skills」を自動で読み込み、Excel操作や独自ガイドラインの順守など、専門的な作業の精度を高める。API経由でも利用可能だ。
AnthropicのClaude、有害な会話を自ら終了する機能を試験導入 “AIの福祉”研究の一環
Anthropicは、「Claude Opus 4/4.1」が有害または虐待的な会話を最後の手段として自ら終了する実験的機能を発表した。「AI welfare」に関する研究の一環で、事前テストではAIが“苦痛”のパターンを示すことが観察されたという。
AIがサイト閲覧、自動クリック・入力も Chrome拡張「Claude for Chrome」のテスター募集 攻撃受けるリスクあり
Webブラウザ上で、Claude AIが自動的にボタンクリックやフォーム入力を行うChrome拡張「Claude for Chrome」のテスターを募集。
Anthropic、「Claude」の使用ポリシーを更新 エージェント機能の悪用規制を明示
Anthropicは、AI「Claude」の使用ポリシーを9月15日付で更新すると発表した。エージェント機能の進化を受け、マルウェア作成やサイバー攻撃などの悪用を具体的に禁止。一方、政治的コンテンツに関する制限は一部緩和する。

