サイバーエージェントは1月27日、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを無料公開した。「DeepSeek-R1-Distill-Qwen-14B/32B」をベースに、日本語を追加学習させたLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」をHugging Face上で公開。ライセンスは、MITライセンスで商用利用なども可能だ。
DeepSeek-R1は、中国のスタートアップ・DeepSeekが開発したLLM。一部分野において、米OpenAIのLLM「o1」に匹敵する性能とうたっている。無料で利用できて高性能であるため、世界中のAI開発者から注目を集めている。
生成AIの最新テクノロジーや活用トレンドを解説
生成AIでどのように業務を変革していくべきなのか──企業の生成AI活用について、ITmediaのIT&ビジネス系メディアが総力でお届けする「ITmedia AI Boost」を開催します。企業のリアルな事例や専門家の詳しい解説などを配信します。
「DeepSeek」ショック? 高性能な中国産AIの登場で、アジア株・米国株先物とともに下落
「Llama 3.1」の日本語追加学習モデル、サイバーエージェントが公開 SNSでは「爆速すぎる」の声
話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるか あれこれ質問した
OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから 商用利用可
サイバーエージェントはなぜ“基盤モデル”を開発するの? 生成AIブームの今知りたい、AIベンダーの動向Copyright © ITmedia, Inc. All Rights Reserved.