「DeepSeek V3」に“改良版”がひっそり登場 「性能が大幅に向上」とXで話題に 応答速度も4倍速く?
中国AI企業のDeepSeekは3月24日(現地時間)、AIモデル「DeepSeek V3-0324」(V3-0324)をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」(V3)の改良版とみられる。V3-0324について公式からのアナウンスはないが、Xでは「性能が大幅に向上している」などと話題を呼んでいる。
V3は、6710億パラメータを持ち、タスクに応じて使う領域を選んで計算効率を高める技術「Mixture of Experts」(MoE)を採用したAIモデル。DeepSeekは、開発費用を抑えながら、各種ベンチマークで米OpenAIのAIモデル「GPT-4o」に匹敵する性能を持つとアピールしている。なお同社の推論モデル「DeepSeek R1」はV3をもとに開発したモデル。
Hugging Faceの記載では、V3-0324は6850億パラメータに増加。商業利用も可能なMITライセンスのもとで公開している。
X上では、V3-0324を試したユーザーから「特に数学(タスク)で大きな改善がみられる」や「多言語のベンチマークでDeepSeek R1やGPT o3-miniと競合する(性能を示した)」などの声が出ている。
なお25日午後1時点で、V3-0324は具体的にどれほど性能が向上したのか公式にアナウンスがない状況だ。一方、コーディング用AIアシスタント「Cline」を手掛ける米Cline Botは、Cline上でV3-0324が使えるようになったと公式Xで報告し、同モデルの詳細を説明している。
それによると、V3-0324は応答速度をV3の4倍高速化したという。専門分野に関する「エキスパート」も60%増量。フロントエンドコーディング機能を強化したほか、メモリの使用量を削減し計算を高速化する手法「FP8トレーニング」により、計算効率を2倍にした。これにより、数学と推論の能力が向上したとしている。
加えてCline Botは公式Xで、V3-0324と米AnthropicのAIモデル「Claude 3.7 Sonnet」を比較。Claude 3.7 Sonnetは20万トークンのコンテキストウィンドウを備えている一方、V3-0324は12万8000トークンのコンテキストウィンドウを備え、最大毎秒60トークンを生成できるという。
価格についても同様に比較。Claude 3.7 Sonnetは100万トークンあたり入力3ドル(450円、1ドル150円換算)/出力15ドル(2250円、同)であるのに対し、V3-0324は入力0.14ドル(21円、同)/出力0.28ドル(42円)であると説明。Claude 3.7 Sonnetに比べ、V3-0324は「入力コストが21分の1、出力コストが53分の1」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
-
3
公式がワンコーラス公開→AIで無断フルコーラス化、拡散 大原ゆい子氏「無職転生III」OPが被害
-
4
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
5
ChatGPTで広告表示へ 無料・Goプランが対象 6月22日にポリシー更新
-
6
生成AI台頭、経営コンサルの倒産・廃業が過去最多ペース “補助金頼み”限界に
-
7
「Siri AI」の進化に「Geminiそのまま」の誤解――現地取材で見えた“新生Apple Intelligence”の全貌
-
8
考えるSaaSは死に、SoRが生き残る──急成長中Sansan「Contract One」から読み解くリーガルテックの明暗
-
9
サッカーW杯、偽ライブ配信サイトに注意 生成AIで詐欺が巧妙化 Acronisが警告
-
10
Anthropic、最上位「ミュトス」級モデルを一般提供 悪用防ぐ保護機能を備えた「Claude Fable 5」
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR