OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから 商用利用可
中国のAI企業DeepSeekは1月20日(日本時間)までに、米OpenAIの「o1」と同レベルの性能をうたう大規模言語モデル(LLM)「DeepSeek-R1」を公開した。いずれもMITライセンスで、商業利用なども認めている。
大規模な強化学習のみでトレーニングしたという「DeepSeek-R1-Zero」、教師あり微調整を行い、数学やコード生成などでo1に匹敵する性能を実現したとうたうDeepSeek-R1を公開。さらに、DeepSeek-R1をベースに、米MetaのLlamaや中国AlibabaのQwenなどを活用して調整した6つの蒸留(既存の大きなモデルを基に、近い性能を持ったより小さいモデルを開発する手法)モデルも公開した。このうち「DeepSeek-R1-Distill-Qwen-32B」は、複数のベンチマークでo1-miniの性能を上回ったという。
R1はAPIも提供。料金は、100万トークン(おおむね単語数の意)の入力当たり0.55ドル。ただしキャッシュされたトークンが入力された場合は同0.14ドル。出力は同2.19ドル。DeepSeekは他モデルのAPI料金を値引くセールを実施中だが、R1は対象にならない。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ChatGPT vs. Google検索──どっちで調べるのが学習効果が高い? 8日間の実験で検証した研究
-
2
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
3
Sakana AI、初の商用プロダクト「Marlin」リリース その実力は?【出力レポート全文掲載】
-
4
人工知能学会「AIは人間を代替しない」 社会実装へ4提言 安保・著作権にも言及
-
5
データセンターの見回り業務をロボットに 自在に伸びるカメラでくまなく点検できる「ugo mini」
-
6
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
-
7
コンサルの品質、なぜ「バラつく」のか? ガートナーが背景を解説
-
8
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
9
AIで思考力が奪われる? 世界の研究が警告するAIバカの壁【動画あり】
-
10
Sakana AI、初の商用サービスはリサーチ特化 「Deep Research」との違いは? 後発で“ベンチマークも追わない”ワケ
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR