「従来のモデルルーティングはクソ」 コスト35%減で最先端モデルの性能を維持する「Devin Fusion」発表

 コーディングエージェント「Devin」などを提供する米Cognitionは6月29日(現地時間)、複数のAIモデルを使い分けてコーディングする実行基盤(ハーネス)「Devin Fusion」を発表した。同日からDevinのクラウドエージェントでプレビュー版を利用できる。

XでのDevin Fusion発表のポスト。翻訳はGrokによるもの

 「GPT-5.5」やClaude Opus 4.8」などのフロンティアモデルを単体で使用する場合と比較して、35%低いコストで同等性能を維持できるとうたう。「Claude Fable 5」を組み込んだ構成では41%のコスト削減を確認したという。

コーディングベンチマーク「FrontierCode」におけるスコア(縦軸)と処理にかかるコスト(横軸)(出典:公式ブログ)

 「Devin Fusion」の中核は2つの技術だ。一つは「サイドキック」(相棒)と呼ばれ、フロンティアモデルのメインエージェントと、低コストモデルのサイドキックエージェントを並列で動かす手法だ。メインエージェントが計画や最終判断を担い、適宜タスクを相棒に委任する。

メインエージェントとサイドキックエージェントの連携例(出典:公式ブログ)

 もう一つは、タスクの途中でモデルを動的に切り替える「セッション途中の動的ルーティング」だ。タスクの種類と複雑さに応じて適した低コストモデルを選んだり、サイドキックエージェントからメインエージェントに処理を切り替えたりする。

 CognitionはXで「従来のモデルルーティングはクソだ。ベンチマークは通過するが、実際にマージしたいと思うコードを書くことはできない」と指摘。Devin Fusionは実際の使用感も快適なハーネスを目指したとした。同社内で試験導入したところ、マージされたプルリクエストの88%がDevin Fusionで処理されたものだったという。

印刷する
SNSでシェア
SpecialPR

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR