「Cursor」開発の新モデル、コスト1/10で最先端モデル並み性能 第三者機関が評価

 最先端モデル並みの性能を約10分の1のコストで実現――米Cursorのコーディング向けAIモデル「Composer 2.5」がそう評価されている。AIの性能評価と分析を提供する米Artificial Analysisが評価結果を5月21日(日本時間)に公表した。

 Artificial Analysisはコーディングエージェント向けの複数のベンチマークを使った評価指標「Coding Agent Index」で「Cursor CLI」とComposer 2.5 Fast(高価で応答性能が高いモデル)の組み合わせを63点と評価し、同社がテストした組み合わせの中で3位に位置付けた。1位は「Claude Code」と「Claude Opus 4.7(max)」の67点、2位は「Codex」と「GPT-5.5(xhigh)」の65点。

日本時間5月22日時点でのCoding Agent Indexのランキング

 Cursor CLIとComposer 2.5 Fastの組み合わせにおける、1つのタスクの完遂にかかるコストは0.44ドル。Claude CodeとClaude Opus 4.7(max)の組み合わせでは4.14ドル、CodexとGPT-5.5(xhigh)の組み合わせでは4.33ドルのため、Composer 2.5 Fastはそれらのモデルに匹敵する性能を、10分の1のコストで実現できることになる。

日本時間5月22日時点での、各モデルのタスク当たりコストと性能の評価

 Composer 2.5は、Cursorが自社開発するコーディング向けモデルの最新版。前世代「Composer 2」と比べ、持続力が必要な長時間タスクへの対応能力が高まり、複雑な指示に追従できるようになったとうたう。

 Composer 2と同様、中国のAI企業Moonshot AIのオープンソースモデル「Kimi K2.5」を基盤としながら、より複雑な学習環境と学習方法を導入し、前世代を上回る性能を実現したという。

 Composer 2.5はCursorのIDEとCursor CLIでのみ提供される。価格は100万トークン当たり入力0.5ドル、出力2.5ドル。Artificial Analysisが評価した、応答性能を高めたモデルのComposer 2.5 Fastは入力3ドル、出力15ドル。

印刷する
SNSでシェア

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR