“GPT-4超え性能”の日本語特化型LLM　AIスタートアップ・ELYZAが開発　国外プレイヤーとの競争も「諦めない」（1/2 ページ）

» 2024年06月26日 15時25分公開

　東大発のAIスタートアップ企業であるELYZA（東京都文京区）は6月26日、GPT-4を超える性能を持つ日本語特化型の大規模言語モデル（LLM）「Llama-3-ELYZA-JP-70B」を開発したと発表した。AIモデル自体は公開しておらず、今後企業向けに提供していく予定。チャット形式で性能を試せるデモサイトは公開している。

ELYZAの曾根岡侑也代表

　Llama-3-ELYZA-JP-70Bは、米MetaのLLM「Llama-3-70B」をベースに日本語の追加事前学習や指示学習を行って開発したモデル。元のLLMから、日本語性能が大きく向上しているのが特徴。2つのベンチマークで日本語性能を評価したところ、米OpenAIのLLM「GPT-4」の性能を上回り、米AnthropicのLLM「Claude 3 Sonet」や米GoogleのLLM「Gemini 1.5 Flash」とも同等かそれ以上の性能を達成したという。

Llama-3-ELYZA-JP-70Bの性能

　Llama-3-ELYZA-JP-70Bは今後、安全なAPIサービスや共同開発プロジェクトなどを通して、順次企業向けに公開していくという。

　このLLMの軽量版に当たる「Llama-3-ELYZA-JP-8B」も併せて発表。2つのベンチマークで日本語性能を評価したところ、「GPT-3.5 Turbo」や「Claude 3 Haiku」「Gemini 1.0 Pro」に匹敵する性能を記録したという。「8B」については一般公開しており、研究や商業目的で利用できる。

Llama-3-ELYZA-JP-8Bは一般公開中

KDDIグループへ加入、財務面安定で追い風

　同社は3月にLLM「ELYZA-japanese-Llama-2-70b」を発表したばかり。このLLMでは“日本語処理能力でのみ”GPT-4などに匹敵するとしていたが、そこから約3カ月でGPT-4を超える性能を持つ日本語特化LLMを実現させた。

3月の会見時の様子

　この理由について、同社の曾根岡侑也代表はLlama-2からLlama-3への進化に“乗っかれた”のが大きいと説明。4月にKDDIグループの傘下に入ったことも影響したという。「これまでは計算機代を自分たちで稼いで投資してと繰り返していたが、財務基盤が安定したことでちょっと大胆な投資もしやすくなった」（曾根岡代表）

　今後予定しているAPI提供によるビジネスモデルについては、他企業と同じような形で提供していく予定だと考えを明かす。「OpenAIやGoogle、Anthropicは従量課金制で、100万トークンで約3000～4000円、高性能モデルなら1万円ほどの価格。われわれのAPI提供についても同じような土俵で提供していくべきではと考え、模索している」という。

どうなる、国外プレイヤーとの開発競争

　　　　　　 1|2 次のページへ