中国アリババ、DeepSeekの「V3」越えうたうAIモデル「Qwen2.5-Max」公開
中国Alibabaは1月28日、同社が開発する大規模言語モデル(LLM)「Qwen」シリーズの最新モデル「2.5-Max」を公開した。中国のAIスタートアップ・DeepSeekが開発したAIモデル「DeepSeek-R1」のベースとなった「DeepSeek V3」に比べ、複数のベンチマークでより高い性能を示したという。
AlibabaによればQwen2.5-Maxは、複数のエキスパートモデル(特定の作業に強みを持つ小型モデル)を組み合わせ、より高い推論性能を実現したという。20兆を超えるトークン(おおむね単語数の意)で事前学習し、ラベル付きデータで行う追加学習「教師ありファインチューニング」や人間のフィードバックによる強化学習を実施した。
結果、数学から言語まで幅広い知識を問う「LiveBench」や、人間が好む回答ができるかを測る「Arena-Hard」など複数のベンチマークで、DeepSeek V3を上回ったという。米OpenAIのAIモデル「GPT-4o」と比較しても、一部のベンチマークでより高い性能を示したとしている。
Qwen2.5-Maxは、AlibabaのAIチャットサービス「Qwen Chat」で利用可能。APIも提供しており、同社のクラウドサービス「Alibaba Cloud」に登録して手続きをすれば利用できる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
2
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
3
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
「家庭教師のトライ」が学力診断にAI活用 20問解くだけで弱点を推定 生徒と講師の負担減らす
-
6
みずほFGが実現 2週間かかるAIエージェント開発を最短数日にする仕組みとは?
-
7
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
話題の「Claude Mythos」、なんて読む? 「ミトス」か「ミソス」か、はたまた「ミュトス」か
-
10
最新AI「Claude Mythos」がSFすぎる件 研究者の作った”牢”を脱出、悪用懸念で一般公開なし──まるで映画の序章
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR