ITmedia AI＋
生成AI
「従来のモデルルーティングはクソ」　コスト35％減で最先端モデルの性能を維持する「Devin Fusion」発表

「従来のモデルルーティングはクソ」　コスト35％減で最先端モデルの性能を維持する「Devin Fusion」発表

公開 2026年06月30日 13時17分

[ITmedia]

印刷する

　コーディングエージェント「Devin」などを提供する米Cognitionは6月29日（現地時間）、複数のAIモデルを使い分けてコーディングする実行基盤（ハーネス）「Devin Fusion」を発表した。同日からDevinのクラウドエージェントでプレビュー版を利用できる。

XでのDevin Fusion発表のポスト。翻訳はGrokによるもの

　「GPT-5.5」やClaude Opus 4.8」などのフロンティアモデルを単体で使用する場合と比較して、35％低いコストで同等性能を維持できるとうたう。「Claude Fable 5」を組み込んだ構成では41％のコスト削減を確認したという。

コーディングベンチマーク「FrontierCode」におけるスコア（縦軸）と処理にかかるコスト（横軸）（出典：公式ブログ）

　「Devin Fusion」の中核は2つの技術だ。一つは「サイドキック」（相棒）と呼ばれ、フロンティアモデルのメインエージェントと、低コストモデルのサイドキックエージェントを並列で動かす手法だ。メインエージェントが計画や最終判断を担い、適宜タスクを相棒に委任する。

メインエージェントとサイドキックエージェントの連携例（出典：公式ブログ）

　もう一つは、タスクの途中でモデルを動的に切り替える「セッション途中の動的ルーティング」だ。タスクの種類と複雑さに応じて適した低コストモデルを選んだり、サイドキックエージェントからメインエージェントに処理を切り替えたりする。

　CognitionはXで「従来のモデルルーティングはクソだ。ベンチマークは通過するが、実際にマージしたいと思うコードを書くことはできない」と指摘。Devin Fusionは実際の使用感も快適なハーネスを目指したとした。同社内で試験導入したところ、マージされたプルリクエストの88％がDevin Fusionで処理されたものだったという。

印刷する