中国AI企業のDeepSeekは3月24日(現地時間)、AIモデル「DeepSeek V3-0324」(V3-0324)をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」(V3)の改良版とみられる。V3-0324について公式からのアナウンスはないが、Xでは「性能が大幅に向上している」などと話題を呼んでいる。
V3は、6710億パラメータを持ち、タスクに応じて使う領域を選んで計算効率を高める技術「Mixture of Experts」(MoE)を採用したAIモデル。DeepSeekは、開発費用を抑えながら、各種ベンチマークで米OpenAIのAIモデル「GPT-4o」に匹敵する性能を持つとアピールしている。なお同社の推論モデル「DeepSeek R1」はV3をもとに開発したモデル。
Hugging Faceの記載では、V3-0324は6850億パラメータに増加。商業利用も可能なMITライセンスのもとで公開している。
X上では、V3-0324を試したユーザーから「特に数学(タスク)で大きな改善がみられる」や「多言語のベンチマークでDeepSeek R1やGPT o3-miniと競合する(性能を示した)」などの声が出ている。
なお25日午後1時点で、V3-0324は具体的にどれほど性能が向上したのか公式にアナウンスがない状況だ。一方、コーディング用AIアシスタント「Cline」を手掛ける米Cline Botは、Cline上でV3-0324が使えるようになったと公式Xで報告し、同モデルの詳細を説明している。
それによると、V3-0324は応答速度をV3の4倍高速化したという。専門分野に関する「エキスパート」も60%増量。フロントエンドコーディング機能を強化したほか、メモリの使用量を削減し計算を高速化する手法「FP8トレーニング」により、計算効率を2倍にした。これにより、数学と推論の能力が向上したとしている。
加えてCline Botは公式Xで、V3-0324と米AnthropicのAIモデル「Claude 3.7 Sonnet」を比較。Claude 3.7 Sonnetは20万トークンのコンテキストウィンドウを備えている一方、V3-0324は12万8000トークンのコンテキストウィンドウを備え、最大毎秒60トークンを生成できるという。
価格についても同様に比較。Claude 3.7 Sonnetは100万トークンあたり入力3ドル(450円、1ドル150円換算)/出力15ドル(2250円、同)であるのに対し、V3-0324は入力0.14ドル(21円、同)/出力0.28ドル(42円)であると説明。Claude 3.7 Sonnetに比べ、V3-0324は「入力コストが21分の1、出力コストが53分の1」としている。
Copyright © ITmedia, Inc. All Rights Reserved.