中国DeepSeekから新LLM「V3.2-Speciale」 「GPT-5超え、Gemini-3.0-Proに匹敵」うたう
AIスタートアップの中国DeepSeekが、新しい大規模言語モデル(LLM)として、10月に発表した「DeepSeek-V3.2-Exp」の後継版「DeepSeek-V3.2」と、その高性能版「DeepSeek-V3.2-Speciale」をHugging Faceで公開した。
AIスタートアップの中国DeepSeekは12月1日(日本時間、以下同)、新しい大規模言語モデル(LLM)として、10月に発表した「DeepSeek-V3.2-Exp」の後継版「DeepSeek-V3.2」と、その高性能版「DeepSeek-V3.2-Speciale」をHugging Faceで公開した。V3.2は米OpenAIの「GPT-5」に匹敵するといい、SpecialeはGPT-5以上かつ米Googleの「Gemini-3.0-Pro」と同等の性能とうたう。いずれも商業利用も可能なMITライセンスで公開する。
V3.2は長考するモードとそうでないモードを切り替え可能で、どちらも外部ツール・サービスの操作に対応するという。Specialeはトークン消費量が多い代わりに複雑なタスクの対処に長けるといい、2025年の国際数学オリンピックや国際情報オリンピックで金メダルを取れるレベルの能力を持つとしている。ただしSpecialeは現時点で外部ツール・サービスの操作に対応していない。
V3.2は同社が手掛けるWeb上のチャットUIやスマートフォンアプリ、APIからも提供。SpecialeはAPIを提供する。API料金はV3.2が100万トークン(おおむね単語数の意)の入力当たり0.28ドル(2日時点で約44円)。ただしキャッシュされたトークンが入力された場合は同0.028ドル(同4.4円)。出力は同0.42ドル(同65円)。Specialeの料金体系は異なるが、16日までは一時的に同じ価格で提供する。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「DeepSeek V3」に“改良版”がひっそり登場 「性能が大幅に向上」とXで話題に 応答速度も4倍速く?
中国AI企業のDeepSeekは、AIモデル「DeepSeek V3-0324」をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」の改良版とみられる。
話題の中華LLM「DeepSeek R1」の日本語追加学習モデル サイバーエージェントが無料公開
サイバーエージェントは、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを公開した。
中国発AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か
AI開発企業の中国DeepSeekは、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。
中国アリババ、DeepSeekの「V3」越えうたうAIモデル「Qwen2.5-Max」公開
中国Alibabaは、大規模言語モデル「Qwen」シリーズの最新モデル「2.5-Max」を公開した。
DeepSeek、マルチモーダルAIモデル「Janus-Pro」をHugging Faceで公開
中国DeepSeekは、マルチモーダルなAIモデル「Janus-Pro」を発表した。Hugging Faceで1BモデルをMITおよびDeepSeekライセンスで公開。画像生成能力はOpenAIのDALL・E 3などより高いとしている。
