Claudeを“コスパ良く”利用可能に 性能の異なるモデルが“適材適所”で稼働、Anthropicの新ツール
米Anthropicは、性能が異なるAIモデルを“適材適所”で稼働させ、自律的にタスクをこなす際のコストパフォーマンスを高める「The advisor strategy」(アドバイザー戦略)を発表した。
米Anthropicは4月9日(現地時間)、性能が異なるAIモデルを“適材適所”で稼働させ、自律的にタスクをこなす際のコストパフォーマンスを高める「The advisor strategy」(アドバイザー戦略)を発表した。同戦略を実行する「The advisor tool」(アドバイザーツール)をAPI向けに提供する。
同戦略では、同社のAI「Claude」の最上位モデル「Opus」を「顧問役」に、中位以下の「Sonnet」「Haiku」を「実行役」に設定する。SonnetとHaikuが基本のタスクを実行し、処理に行き詰まると、OpusがSonnetとHaikuに対処法をアドバイスする。
ソフトウェアの開発性能を測るベンチマークでは、Opus+SonnetはSonnet単体より2.7%高いスコアを示し、自律的にタスクをこなす際のコストを11.9%削減した。Web検索やターミナル環境での開発性能を測るベンチマークでもスコアは高まり、コストは低くなったとアピールしている。
なお、Opus+Haikuの場合、Haiku単体より性能は高まったものの、コストも同時に上昇したという。
アドバイザーツールは、ClaudeのMessages APIで利用できる。処理は単一のリクエスト内で実行され、料金は顧問役と実行役になる各AIモデルの使用料金で計算される。顧問役は1回の処理につき、基本的に400〜700トークンほどのアドバイスを出力するとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
本番環境のAIエージェント開発を「10倍」高速化――「Claude Managed Agents」発表
Anthropicは、本番運用向けAIエージェントの構築、運用を効率化する「Claude Managed Agents」のパブリックβ版を公開した。実行環境やマルチエージェント協調機能を備え、開発の「10倍」高速化をうたう。
Anthropic、AIによる脆弱性対策「Project Glasswing」立ち上げ Apple、Microsoft、Googleなどが参加
Anthropicは、高度AIによるソフトウェア脆弱性の自動発見・悪用リスクに対応する「Project Glasswing」を発表した。未公開モデル「Claude Mythos Preview」を活用し、AppleやGoogleなど大手IT企業と連携して重要インフラの安全性を高める。攻撃転用を防ぐためモデルは一般公開せず、防御側に先行優位性を与える方針だ。
LLMにも「愛ゆえの盲目」「絶望して脅迫」がある Claudeの“感情”が動作に影響――Anthropicが研究報告
Anthropicは、LLMが内部で感情表現を生成し、それが挙動に直接影響を与えることを解明した。「絶望」などの感情表現が問題行動を誘発する一方、制御により抑制も可能だという。
「Claude」の利用上限が2倍に 日本では“夜以外”適用 期間限定で
米Anthropicが、チャットAI「Claude」などで、ピーク時以外の利用上限を2倍に引き上げるキャンペーンを実施している。
Anthropic、AIエージェントのVercept買収 ClaudeのPC操作機能を強化へ
Anthropicは、自律型AIエージェント開発のVerceptを買収した。VerceptはPC上で直接動作し、画面操作やワークフローを代行するAI「Vy」を展開。Anthropicはこの技術を「Claude」の「Computer Use」に統合し、複雑なタスクの自動化を加速させる。Verceptの既存サービスは終了する。


