サイバーエージェントは7月26日、米Metaの最新AIモデル「Llama 3.1 70B」を使った新たな大規模言語モデル(LLM)を公開した。Llama 3.1 70Bをベースに、日本語データを追加学習させたもので、Hugging Face上で公開している。ライセンスはMetaの「Llama 3.1 Community License」に基づいており、商用利用可能だが、利用規約などに同意が必要となる。
「Llama 3.1」シリーズはMetaが24日(現地時間)に公開した最新LLM。15兆トークンを超えるデータでトレーニングしたとしており、複数のベンチマークで米OpenAIのLLM「GPT-4o」や米AnthropicのLLM「Claude 3.5 Sonnet」より優れているという。
一方、Llama 3.1は日本語へのサポート体制が敷かれておらず、実際に利用した日本のユーザーからは「日本語性能はあまり高くない」などの意見がSNSで上がっていた。そんな中、サイバーエージェントが約2日で日本語学習モデルを公開したため「爆速すぎる」など、そのスピード感に驚きの声が上がっている。
Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」
仏Mistral AI、最新LLM「Mistral Large 2」を公開 コード生成で米Meta「Llama 3.1」と同程度の性能
サイバーエージェント、新たな日本語特化LLMを一般公開 「Llama-3-70B」と同等の日本語能力 商用利用も可
Excelなどの“表計算ソフト専用”の大規模言語モデル 米Microsoftが「SpreadsheetLLM」発表
パナソニック、1000億パラメータの社内専用LLMを開発へ AIスタートアップ・ストックマークと協業Copyright © ITmedia, Inc. All Rights Reserved.