中国アリババ、DeepSeekの「V3」越えうたうAIモデル「Qwen2.5-Max」公開
中国Alibabaは1月28日、同社が開発する大規模言語モデル(LLM)「Qwen」シリーズの最新モデル「2.5-Max」を公開した。中国のAIスタートアップ・DeepSeekが開発したAIモデル「DeepSeek-R1」のベースとなった「DeepSeek V3」に比べ、複数のベンチマークでより高い性能を示したという。
AlibabaによればQwen2.5-Maxは、複数のエキスパートモデル(特定の作業に強みを持つ小型モデル)を組み合わせ、より高い推論性能を実現したという。20兆を超えるトークン(おおむね単語数の意)で事前学習し、ラベル付きデータで行う追加学習「教師ありファインチューニング」や人間のフィードバックによる強化学習を実施した。
結果、数学から言語まで幅広い知識を問う「LiveBench」や、人間が好む回答ができるかを測る「Arena-Hard」など複数のベンチマークで、DeepSeek V3を上回ったという。米OpenAIのAIモデル「GPT-4o」と比較しても、一部のベンチマークでより高い性能を示したとしている。
Qwen2.5-Maxは、AlibabaのAIチャットサービス「Qwen Chat」で利用可能。APIも提供しており、同社のクラウドサービス「Alibaba Cloud」に登録して手続きをすれば利用できる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
5
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
6
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
7
AIに詳しくなくても大丈夫、月額制で中小企業のAI活用をプロが支える新サービス
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
Meta、「Claude Codeと組織改編で爆速開発」のはずが「想定より加速せず」 ザッカーバーグ氏、社内集会で発言
-
10
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR