検索
ニュース

「Llama 3.1」の日本語追加学習モデル、サイバーエージェントが公開 SNSでは「爆速すぎる」の声

サイバーエージェントは、米Metaの最新AIモデル「Llama 3.1 70B」を使った新たな大規模言語モデル(LLM)を公開した。Llama 3.1 70Bをベースに、日本語データを追加学習させたもので、Hugging Face上で公開している。

Share
Tweet
LINE
Hatena

 サイバーエージェントは7月26日、米Metaの最新AIモデル「Llama 3.1 70B」を使った新たな大規模言語モデル(LLM)を公開した。Llama 3.1 70Bをベースに、日本語データを追加学習させたもので、Hugging Face上で公開している。ライセンスはMetaの「Llama 3.1 Community License」に基づいており、商用利用可能だが、利用規約などに同意が必要となる。

 「Llama 3.1」シリーズはMetaが24日(現地時間)に公開した最新LLM。15兆トークンを超えるデータでトレーニングしたとしており、複数のベンチマークで米OpenAIのLLM「GPT-4o」や米AnthropicのLLM「Claude 3.5 Sonnet」より優れているという。


Llama 3.1と他モデルとのベンチマーク比較(Metaの公式Webサイトから引用

 一方、Llama 3.1は日本語へのサポート体制が敷かれておらず、実際に利用した日本のユーザーからは「日本語性能はあまり高くない」などの意見がSNSで上がっていた。そんな中、サイバーエージェントが約2日で日本語学習モデルを公開したため「爆速すぎる」など、そのスピード感に驚きの声が上がっている。


サイバーエージェントのHugging Faceのページから引用

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る