検索
ニュース

ELYZA、新たな日本語言語モデルを一般公開 同社「日本語ならGPT-3.5を上回る性能」 商用利用も可

東大発のAIスタートアップ企業であるELYZAは、商用利用可能な日本語の大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-13b」を公開した。日本語性能の評価では「GPT-3.5(text-davinci-003)」を上回るという。

Share
Tweet
LINE
Hatena

 東大発のAIスタートアップ企業であるELYZA(東京都文京区)は12月27日、商用利用可能な日本語の大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-13b」を公開した。米MetaのLLM「Llama 2」をベースにしており、日本語性能の評価では「GPT-3.5(text-davinci-003)」を上回るという。


ELYZA、新たな日本語言語モデルを一般公開

 パラメータ数は130億で、約180億トークン(おおよそ単語数の意)の日本語テキストで事後学習を行ったモデル。同社は「当社が公開している日本語ベンチマークを使ったテストでは、130億パラメータながら、既存のオープンな700億パラメータモデルをも上回る結果となった」としている。


他モデルとの性能比較(1/2)

他モデルとの性能比較(2/2)

 ライセンスは「Llama 2 Community License」に準拠しており、研究や商業目的での利用が可能。

 ELYZA-japanese-Llama-2-13bを使ったチャット形式のデモもオープンソースAIプラットフォームの「Hugging Face hub」上で公開している。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る