中国アリババ、DeepSeekの「V3」越えうたうAIモデル「Qwen2.5-Max」公開

» 2025年01月29日 17時53分公開

[ITmedia]

　中国Alibabaは1月28日、同社が開発する大規模言語モデル（LLM）「Qwen」シリーズの最新モデル「2.5-Max」を公開した。中国のAIスタートアップ・DeepSeekが開発したAIモデル「DeepSeek-R1」のベースとなった「DeepSeek V3」に比べ、複数のベンチマークでより高い性能を示したという。

　AlibabaによればQwen2.5-Maxは、複数のエキスパートモデル（特定の作業に強みを持つ小型モデル）を組み合わせ、より高い推論性能を実現したという。20兆を超えるトークン（おおむね単語数の意）で事前学習し、ラベル付きデータで行う追加学習「教師ありファインチューニング」や人間のフィードバックによる強化学習を実施した。

　結果、数学から言語まで幅広い知識を問う「LiveBench」や、人間が好む回答ができるかを測る「Arena-Hard」など複数のベンチマークで、DeepSeek V3を上回ったという。米OpenAIのAIモデル「GPT-4o」と比較しても、一部のベンチマークでより高い性能を示したとしている。

ベンチマークの結果（1/2）（画像はQwen開発チームのブログより引用）

ベンチマークの結果（2/2）

　Qwen2.5-Maxは、AlibabaのAIチャットサービス「Qwen Chat」で利用可能。APIも提供しており、同社のクラウドサービス「Alibaba Cloud」に登録して手続きをすれば利用できる。

「DeepSeek-R1は価格に見合った良いAIモデル」──OpenAIのアルトマンCEOが言及　競合出現を歓迎し余裕を見せる
「DeepSeek-R1は価格に見合った性能という点で、素晴らしいAIモデルだ」──米OpenAIのサム・アルトマンCEOは、自身のXアカウント（＠sama）でそのように言及した。
中華AI「DeepSeek」、日本のApp Store無料アプリランキングでも1位に　ChatGPT抑える
1月28日午前10時ごろまでに、AIチャット「DeepSeek」のiOSアプリ版が、日本のApp Store無料アプリランキングで1位になった。DeepSeekは同名の中国AIスタートアップが開発したAIで、その性能から20日のリリース以降大きな話題に。米国でも、27日にApp Store無料アプリランキングで1位になっていた。
話題の中華LLM「DeepSeek R1」の日本語追加学習モデル　サイバーエージェントが無料公開
サイバーエージェントは、大規模言語モデル（LLM）「DeepSeek-R1」を使った新たなAIモデルを公開した。
AI業界に激震、突如公開の中華AI「DeepSeek」“驚きポイント”まとめ
AI開発者やユーザーたちが驚く大規模言語モデル「DeepSeek-R1」。どんなポイントが業界に大きな衝撃を与えているのかか。
OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから　商用利用可
中国のAI企業DeepSeekが、米OpenAIの「o1」と同レベルの性能をうたう大規模言語モデル（LLM）「DeepSeek-R1」を公開した。いずれもMITライセンスで、商業利用なども認めている。