Anthropic、新AIモデル「Claude Sonnet 4.6」発表 “人間レベル”のPC操作も一部可能に

 米Anthropicは2月18日(日本時間)、新たなAIモデル「Claude Sonnet 4.6」を発表した。前モデル「Claude Sonnet 4.5」に比べ、コーディングや自律的なPC操作などの性能が向上したという。同日からチャットAI「Claude」や、AIコーディングツール「Claude Code」などで利用できる。

Anthropic公式Xのプロフィール

 Claude Sonnet 4.6は、これまで同社の最上位のAIモデル「Opus」レベルの性能が必要だったタスクにも対応できるとうたう。自律的にPCを操作する性能を測るベンチマーク「OSWorld」では、過去の「Sonnet」シリーズより高いスコアを記録した。複雑なスプレッドシートの操作や、Webフォームの入力といった一部のタスクでは“人間レベル”の性能を見せたとアピールする。ただし「最もPC操作に習熟した人間」には及ばないとした。

OSWorldの結果(提供:Anthropic、以下同)

 コーディングやユーザーの指示を守る性能なども向上しており、Claude Codeで先行体験したユーザーのうち、約70%がClaude Sonnet 4.6をClaude Sonnet 4.5よりも高く評価した。2025年11月に公開したOpusの前モデル「Claude Opus 4.5」との比較でも、59%がSonnet 4.6の方が優れていると判断したという。

各種ベンチマークの結果

 また、複数の入力にまたがる推論能力が高まったことで、長期的なタスクに対応する性能も向上した。26年2月5日に発表したOpusの最新モデル「Claude Opus 4.6」と同様に100万トークンのコンテキストウィンドウを備えており、悪意のある攻撃への耐性もClaude Opus 4.6と同等としている。

 Claude Sonnet 4.6は同日からClaudeの標準モデルとなり、無料プランのユーザーを含む全ユーザーが使えるようになる。APIでも利用でき、料金は100万トークン当たり入力が3ドル、出力が15ドル。

印刷する
SNSでシェア

この記事の著者

島田拓

島田拓

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR