東大発のAIスタートアップ企業であるELYZA(東京都文京区)は12月27日、商用利用可能な日本語の大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-13b」を公開した。米MetaのLLM「Llama 2」をベースにしており、日本語性能の評価では「GPT-3.5(text-davinci-003)」を上回るという。
パラメータ数は130億で、約180億トークン(おおよそ単語数の意)の日本語テキストで事後学習を行ったモデル。同社は「当社が公開している日本語ベンチマークを使ったテストでは、130億パラメータながら、既存のオープンな700億パラメータモデルをも上回る結果となった」としている。
ライセンスは「Llama 2 Community License」に準拠しており、研究や商業目的での利用が可能。
ELYZA-japanese-Llama-2-13bを使ったチャット形式のデモもオープンソースAIプラットフォームの「Hugging Face hub」上で公開している。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR