「DeepSeek V3」に“改良版”がひっそり登場 「性能が大幅に向上」とXで話題に 応答速度も4倍速く?
中国AI企業のDeepSeekは3月24日(現地時間)、AIモデル「DeepSeek V3-0324」(V3-0324)をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」(V3)の改良版とみられる。V3-0324について公式からのアナウンスはないが、Xでは「性能が大幅に向上している」などと話題を呼んでいる。
V3は、6710億パラメータを持ち、タスクに応じて使う領域を選んで計算効率を高める技術「Mixture of Experts」(MoE)を採用したAIモデル。DeepSeekは、開発費用を抑えながら、各種ベンチマークで米OpenAIのAIモデル「GPT-4o」に匹敵する性能を持つとアピールしている。なお同社の推論モデル「DeepSeek R1」はV3をもとに開発したモデル。
Hugging Faceの記載では、V3-0324は6850億パラメータに増加。商業利用も可能なMITライセンスのもとで公開している。
X上では、V3-0324を試したユーザーから「特に数学(タスク)で大きな改善がみられる」や「多言語のベンチマークでDeepSeek R1やGPT o3-miniと競合する(性能を示した)」などの声が出ている。
なお25日午後1時点で、V3-0324は具体的にどれほど性能が向上したのか公式にアナウンスがない状況だ。一方、コーディング用AIアシスタント「Cline」を手掛ける米Cline Botは、Cline上でV3-0324が使えるようになったと公式Xで報告し、同モデルの詳細を説明している。
それによると、V3-0324は応答速度をV3の4倍高速化したという。専門分野に関する「エキスパート」も60%増量。フロントエンドコーディング機能を強化したほか、メモリの使用量を削減し計算を高速化する手法「FP8トレーニング」により、計算効率を2倍にした。これにより、数学と推論の能力が向上したとしている。
加えてCline Botは公式Xで、V3-0324と米AnthropicのAIモデル「Claude 3.7 Sonnet」を比較。Claude 3.7 Sonnetは20万トークンのコンテキストウィンドウを備えている一方、V3-0324は12万8000トークンのコンテキストウィンドウを備え、最大毎秒60トークンを生成できるという。
価格についても同様に比較。Claude 3.7 Sonnetは100万トークンあたり入力3ドル(450円、1ドル150円換算)/出力15ドル(2250円、同)であるのに対し、V3-0324は入力0.14ドル(21円、同)/出力0.28ドル(42円)であると説明。Claude 3.7 Sonnetに比べ、V3-0324は「入力コストが21分の1、出力コストが53分の1」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
6
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
-
7
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
10
光接続の標準規格「OCI」対応シリコン、GFが27年に投入
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR