「DeepSeek V3」に“改良版”がひっそり登場 「性能が大幅に向上」とXで話題に 応答速度も4倍速く?
中国AI企業のDeepSeekは3月24日(現地時間)、AIモデル「DeepSeek V3-0324」(V3-0324)をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」(V3)の改良版とみられる。V3-0324について公式からのアナウンスはないが、Xでは「性能が大幅に向上している」などと話題を呼んでいる。
V3は、6710億パラメータを持ち、タスクに応じて使う領域を選んで計算効率を高める技術「Mixture of Experts」(MoE)を採用したAIモデル。DeepSeekは、開発費用を抑えながら、各種ベンチマークで米OpenAIのAIモデル「GPT-4o」に匹敵する性能を持つとアピールしている。なお同社の推論モデル「DeepSeek R1」はV3をもとに開発したモデル。
Hugging Faceの記載では、V3-0324は6850億パラメータに増加。商業利用も可能なMITライセンスのもとで公開している。
X上では、V3-0324を試したユーザーから「特に数学(タスク)で大きな改善がみられる」や「多言語のベンチマークでDeepSeek R1やGPT o3-miniと競合する(性能を示した)」などの声が出ている。
なお25日午後1時点で、V3-0324は具体的にどれほど性能が向上したのか公式にアナウンスがない状況だ。一方、コーディング用AIアシスタント「Cline」を手掛ける米Cline Botは、Cline上でV3-0324が使えるようになったと公式Xで報告し、同モデルの詳細を説明している。
それによると、V3-0324は応答速度をV3の4倍高速化したという。専門分野に関する「エキスパート」も60%増量。フロントエンドコーディング機能を強化したほか、メモリの使用量を削減し計算を高速化する手法「FP8トレーニング」により、計算効率を2倍にした。これにより、数学と推論の能力が向上したとしている。
加えてCline Botは公式Xで、V3-0324と米AnthropicのAIモデル「Claude 3.7 Sonnet」を比較。Claude 3.7 Sonnetは20万トークンのコンテキストウィンドウを備えている一方、V3-0324は12万8000トークンのコンテキストウィンドウを備え、最大毎秒60トークンを生成できるという。
価格についても同様に比較。Claude 3.7 Sonnetは100万トークンあたり入力3ドル(450円、1ドル150円換算)/出力15ドル(2250円、同)であるのに対し、V3-0324は入力0.14ドル(21円、同)/出力0.28ドル(42円)であると説明。Claude 3.7 Sonnetに比べ、V3-0324は「入力コストが21分の1、出力コストが53分の1」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
2
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
-
3
最新AI「Fable 5」でYouTube動画作ってみた 想像以上の出来に驚愕、ただし大きな弱点も
-
4
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
5
トヨタが抜かれる日――キオクシア首位奪取、2005年「時価総額トップ10」を振り返る
-
6
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
7
「人型ロボ世界シェア1位」中国Unitreeに聞く“普及戦略” 日本市場をどう開拓?
-
8
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
9
東大松尾研が「LLM講座 基礎編」の講義資料を無料公開 期間限定で
-
10
LINEヤフー、AI強化へ若手エンジニア募集 新卒・第二新卒、給与に一律の上限なし
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR