米Anthropicは10月15日(現地時間)、Claudeの最小モデルの最新版「Claude Haiku 4.5」をリリースしたと発表した。高性能LLMの旧版「Sonnet 4」と同等の性能を「3分の1のコストで2倍以上の速度」で提供するとしている。
Haikuは、AnthropicのLLMファミリーの中で、小型で高速なモデルクラスに位置づけられている。Haiku 4.5は、最も強力なAIの軽量バージョンであり、より手頃な価格で、最速かつ最もインテリジェントなモデルとして導入された。前バージョンは昨年10月のリリースだった。
Haiku 4.5の大きな特徴は高速性とコスト効率で、コーディングやエージェントタスクにおいて、Sonnet 4と同等の性能を発揮する点という。特に、速度とコストを効率化しつつフロンティアレベルに近い性能を実現していると強調している。
9月末にリリースした「Sonnet 4.5」と比較して、速度は4〜5倍でコストはわずかという。この高速性により、応答時間が重要なカスタマーサービスエージェントやリアルタイムチャットボットなど、レイテンシの影響を受けやすい体験に最適としている。また、複雑なリファクタリングや大規模な機能構築に対応するマルチエージェントシステムを可能にするコーディングサブエージェントとしての利用、リアルタイムでの金融分析、リサーチサブエージェントとしての応用もユースケースとして挙げられている。
Haiku 4.5は同日から、すべてのユーザーが利用可能だ。Claude.ai(Web、iOS、Android)で誰でもチャットにHaiku 4.5を使用できる。開発者は、Claude APIを介して「claude-haiku-4-5」を使用でき、Amazon BedrockやGoogle CloudのVertex AIでも提供されている。GitHub Copilotにおいても、Copilot Pro、Pro+、Business、Enterpriseプランのユーザー向けにロールアウト中だ。価格設定は、Claude Developer Platformで、入力トークン100万当たり1ドル、出力トークン100万当たり5ドルからとなっている。
Anthropicは、ベンチマーク「SWE-bench Verified」のスコアを示した。73.3%というスコアは、世界で最も優れたコーディングモデルの1つだとしている。
システムカードで明示された問題点として、Claude Haiku 4.5は「評価認識」(Evaluation Awareness)の高い割合を示した点が指摘されている。これは、モデルが比較的ありそうもないシナリオに置かれた際に、自分がテストまたは評価環境にあるのではないかと公然と推測する行動だ。この評価認識の発生率は、主要な自動監査スイートにおいて約9%のシナリオで見られ、結果の信頼性をある程度低下させているという。また、化学・生物・放射線・核(CBRN)兵器などの科学的な機密トピックに対する悪意のある要求に対して、Haiku 3.5が直接拒否していたのに対し、Haiku 4.5は学術的または教育的な意図を想定し、高レベルの理論的な情報を提供してしまうケースがまれに観察された。
Anthropic、「Claude Sonnet 4.5」リリース コーディング性能と安全性が向上
Anthropic著作権侵害訴訟、和解へ──史上最高額の著作権回収に
米Anthropic、AIモデル「Claude Opus 4.1」を発表 Opus 4のアップグレード版 ほぼ全性能が向上
Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表Copyright © ITmedia, Inc. All Rights Reserved.