「Claude Sonnet 5」新登場 低コストでOpus 4.8に匹敵とうたうも、タスク当たりコスト増加との評価も

 米Anthropicは6月30日(現地時間)、新しいAIモデル「Claude Sonnet 5」(以下、Sonnet 5)を発表した。同日から「Claude」の全プランとAPIで提供する。上位モデル「Claude Opus 4.8」(以下、Opus 4.8)に迫る性能を低価格で実現するとうたうが、第三者機関の評価では1タスク当たりのトークン使用量が大きいためコスト優位が薄れるとの指摘もある。

 Anthropicによると、Sonnet 5は前世代の「Claude Sonnet 4.6」(以下、Sonnet 4.6)からツール利用やコーディング、ナレッジワークなどの能力が大幅に向上した。推論の深さや長さを示す「Effort」レベルを上げると、エージェントが自律的に検索する能力など一部のタスクでOpus 4.8に匹敵する場合もあるという。

Sonnet 4.6、Opus 4.8との比較(出典:Anthropicの公式ブログ)
エージェンティック検索のパフォーマンス(出典:Anthropicの公式ブログ)

 AIの性能評価と分析を提供する米Artificial Analysisの評価でも、総合指標「Intelligence Index」で53ポイントを取り、Sonnet 4.6が獲得した47ポイントを上回った。Opus 4.8に3ポイント差、米OpenAIのAIモデル「GPT-5.5」に2ポイント差まで迫った。

Artificial Analysisによる評価(出典:Artificial Analysisの公式X)

 安全性はSonnet 4.6から全体的に改善したとする。悪意ある要求の拒否やプロンプトインジェクションへの耐性が高まり、ハルシネーションやユーザーへの過度な迎合も減ったという。サイバー攻撃の能力はOpus 4.8や「Claude Mythos 5」より大幅に低いが、Sonnet 4.6と比較すると脆弱(ぜいじゃく)性悪用の成功率が上がっているため、危険な用途での利用を検知し、ブロックする機能を有効にして提供すると説明している。

 APIの価格は100万トークン当たり入力3ドル、出力15ドルで、8月31日までは入力2ドル、出力10ドルで利用できる。Opus 4.8(入力5ドル、出力25ドル)より安価だ。

 一方、Artificial Analysisは、Sonnet 5がSonnet 4.6より出力トークンを1タスク当たり約40%多く使用するため、1タスク当たり約2倍のコストがかかると指摘。Opus 4.8と比較しても約15%上回るとした。

パフォーマンスと1タスク当たりのトークン使用量(出典:Artificial Analysisの公式X)
パフォーマンスと1タスク当たりのコスト(出典:Artificial Analysisの公式X)
印刷する
SNSでシェア
SpecialPR

この記事の著者

村田知己

村田知己

ITmedia AI+ 編集記者。市場調査会社でのエンジニア職を経て、2022年アイティメディア入社。キーマンズネット編集部、社内のデータ分析基盤構築担当、ITmedia エンタープライズ編集部を経て現職。

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR