ニュース
話題の中華LLM「DeepSeek R1」の日本語追加学習モデル サイバーエージェントが無料公開
サイバーエージェントは、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを公開した。
サイバーエージェントは1月27日、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを無料公開した。「DeepSeek-R1-Distill-Qwen-14B/32B」をベースに、日本語を追加学習させたLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」をHugging Face上で公開。ライセンスは、MITライセンスで商用利用なども可能だ。
DeepSeek-R1は、中国のスタートアップ・DeepSeekが開発したLLM。一部分野において、米OpenAIのLLM「o1」に匹敵する性能とうたっている。無料で利用できて高性能であるため、世界中のAI開発者から注目を集めている。
生成AIの最新テクノロジーや活用トレンドを解説
生成AIでどのように業務を変革していくべきなのか──企業の生成AI活用について、ITmediaのIT&ビジネス系メディアが総力でお届けする「ITmedia AI Boost」を開催します。企業のリアルな事例や専門家の詳しい解説などを配信します。
- イベント「ITmedia AI Boost」
- 開催期間:2025年2月18日(火)〜2月19日(水)
- 無料でご視聴いただけます
- こちらから無料登録してご視聴ください
- 主催:ITmedia AI+、 ITmedia ビジネスオンライン、 ITmedia エンタープライズ、 @IT
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「DeepSeek」ショック? 高性能な中国産AIの登場で、アジア株・米国株先物とともに下落
中国のスタートアップDeepSeekが米OpenAIのChatGPTに対抗する無料のAIモデルを発表した影響を受け、1月27日に米国株先物と中国以外のアジア株が急落した。
「Llama 3.1」の日本語追加学習モデル、サイバーエージェントが公開 SNSでは「爆速すぎる」の声
サイバーエージェントは、米Metaの最新AIモデル「Llama 3.1 70B」を使った新たな大規模言語モデル(LLM)を公開した。Llama 3.1 70Bをベースに、日本語データを追加学習させたもので、Hugging Face上で公開している。
話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるか あれこれ質問した
AIユーザー・開発者たちの話題をさらった大規模言語モデル(LLM)「DeepSeek-R1」。開発元が中国企業ということもあり、答える内容の偏りなどを懸念する声も多い。筆者も実際に試したが、環境によっては確かに回答が得られない質問が存在した。
OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから 商用利用可
中国のAI企業DeepSeekが、米OpenAIの「o1」と同レベルの性能をうたう大規模言語モデル(LLM)「DeepSeek-R1」を公開した。いずれもMITライセンスで、商業利用なども認めている。
サイバーエージェントはなぜ“基盤モデル”を開発するの? 生成AIブームの今知りたい、AIベンダーの動向
生成AIブームの今、注目のキーワードが「基盤モデル」だ。各AIベンダーたちの間で基盤モデルの開発競争が激化する中、それぞれの開発状況や強みを探っていく。今回は、サイバーエージェントに話を聞いた。


