Anthropic、「Claude Haiku 4.5」リリース Sonnet 4の性能を3分の1のコストで実現
米Anthropicは10月15日(現地時間)、Claudeの最小モデルの最新版「Claude Haiku 4.5」をリリースしたと発表した。高性能LLMの旧版「Sonnet 4」と同等の性能を「3分の1のコストで2倍以上の速度」で提供するとしている。
Haikuは、AnthropicのLLMファミリーの中で、小型で高速なモデルクラスに位置づけられている。Haiku 4.5は、最も強力なAIの軽量バージョンであり、より手頃な価格で、最速かつ最もインテリジェントなモデルとして導入された。前バージョンは昨年10月のリリースだった。
Haiku 4.5の大きな特徴は高速性とコスト効率で、コーディングやエージェントタスクにおいて、Sonnet 4と同等の性能を発揮する点という。特に、速度とコストを効率化しつつフロンティアレベルに近い性能を実現していると強調している。
9月末にリリースした「Sonnet 4.5」と比較して、速度は4~5倍でコストはわずかという。この高速性により、応答時間が重要なカスタマーサービスエージェントやリアルタイムチャットボットなど、レイテンシの影響を受けやすい体験に最適としている。また、複雑なリファクタリングや大規模な機能構築に対応するマルチエージェントシステムを可能にするコーディングサブエージェントとしての利用、リアルタイムでの金融分析、リサーチサブエージェントとしての応用もユースケースとして挙げられている。
Haiku 4.5は同日から、すべてのユーザーが利用可能だ。Claude.ai(Web、iOS、Android)で誰でもチャットにHaiku 4.5を使用できる。開発者は、Claude APIを介して「claude-haiku-4-5」を使用でき、Amazon BedrockやGoogle CloudのVertex AIでも提供されている。GitHub Copilotにおいても、Copilot Pro、Pro+、Business、Enterpriseプランのユーザー向けにロールアウト中だ。価格設定は、Claude Developer Platformで、入力トークン100万当たり1ドル、出力トークン100万当たり5ドルからとなっている。
Anthropicは、ベンチマーク「SWE-bench Verified」のスコアを示した。73.3%というスコアは、世界で最も優れたコーディングモデルの1つだとしている。
システムカードで明示された問題点として、Claude Haiku 4.5は「評価認識」(Evaluation Awareness)の高い割合を示した点が指摘されている。これは、モデルが比較的ありそうもないシナリオに置かれた際に、自分がテストまたは評価環境にあるのではないかと公然と推測する行動だ。この評価認識の発生率は、主要な自動監査スイートにおいて約9%のシナリオで見られ、結果の信頼性をある程度低下させているという。また、化学・生物・放射線・核(CBRN)兵器などの科学的な機密トピックに対する悪意のある要求に対して、Haiku 3.5が直接拒否していたのに対し、Haiku 4.5は学術的または教育的な意図を想定し、高レベルの理論的な情報を提供してしまうケースがまれに観察された。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
3
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
4
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
5
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
6
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
7
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
8
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
9
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
10
Meta、「Claude Codeと組織改編で爆速開発」のはずが「想定より加速せず」 ザッカーバーグ氏、社内集会で発言
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR