「DeepSeek V3」に“改良版”がひっそり登場 「性能が大幅に向上」とXで話題に 応答速度も4倍速く?
中国AI企業のDeepSeekは3月24日(現地時間)、AIモデル「DeepSeek V3-0324」(V3-0324)をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」(V3)の改良版とみられる。V3-0324について公式からのアナウンスはないが、Xでは「性能が大幅に向上している」などと話題を呼んでいる。
V3は、6710億パラメータを持ち、タスクに応じて使う領域を選んで計算効率を高める技術「Mixture of Experts」(MoE)を採用したAIモデル。DeepSeekは、開発費用を抑えながら、各種ベンチマークで米OpenAIのAIモデル「GPT-4o」に匹敵する性能を持つとアピールしている。なお同社の推論モデル「DeepSeek R1」はV3をもとに開発したモデル。
Hugging Faceの記載では、V3-0324は6850億パラメータに増加。商業利用も可能なMITライセンスのもとで公開している。
X上では、V3-0324を試したユーザーから「特に数学(タスク)で大きな改善がみられる」や「多言語のベンチマークでDeepSeek R1やGPT o3-miniと競合する(性能を示した)」などの声が出ている。
なお25日午後1時点で、V3-0324は具体的にどれほど性能が向上したのか公式にアナウンスがない状況だ。一方、コーディング用AIアシスタント「Cline」を手掛ける米Cline Botは、Cline上でV3-0324が使えるようになったと公式Xで報告し、同モデルの詳細を説明している。
それによると、V3-0324は応答速度をV3の4倍高速化したという。専門分野に関する「エキスパート」も60%増量。フロントエンドコーディング機能を強化したほか、メモリの使用量を削減し計算を高速化する手法「FP8トレーニング」により、計算効率を2倍にした。これにより、数学と推論の能力が向上したとしている。
加えてCline Botは公式Xで、V3-0324と米AnthropicのAIモデル「Claude 3.7 Sonnet」を比較。Claude 3.7 Sonnetは20万トークンのコンテキストウィンドウを備えている一方、V3-0324は12万8000トークンのコンテキストウィンドウを備え、最大毎秒60トークンを生成できるという。
価格についても同様に比較。Claude 3.7 Sonnetは100万トークンあたり入力3ドル(450円、1ドル150円換算)/出力15ドル(2250円、同)であるのに対し、V3-0324は入力0.14ドル(21円、同)/出力0.28ドル(42円)であると説明。Claude 3.7 Sonnetに比べ、V3-0324は「入力コストが21分の1、出力コストが53分の1」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
2
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
3
キオクシア社長「記録的な増収増益」 3カ月の売上収益1兆円、純利益は2990%増 好決算の背景は
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
6
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
7
NEC社長が説く AI時代と新たな安全保障環境の到来で「ITサービスはこう変わる」
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
「邪魔すぎ」――LINE入力欄の“新AI機能”が不評 消し方は?
-
10
Python 3.15に追加されるlazy importと内包表記でのアンパッキングについて調べてみた
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR