ニュース
ELYZA、新たな日本語言語モデルを一般公開 同社「日本語ならGPT-3.5を上回る性能」 商用利用も可
東大発のAIスタートアップ企業であるELYZAは、商用利用可能な日本語の大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-13b」を公開した。日本語性能の評価では「GPT-3.5(text-davinci-003)」を上回るという。
東大発のAIスタートアップ企業であるELYZA(東京都文京区)は12月27日、商用利用可能な日本語の大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-13b」を公開した。米MetaのLLM「Llama 2」をベースにしており、日本語性能の評価では「GPT-3.5(text-davinci-003)」を上回るという。
パラメータ数は130億で、約180億トークン(おおよそ単語数の意)の日本語テキストで事後学習を行ったモデル。同社は「当社が公開している日本語ベンチマークを使ったテストでは、130億パラメータながら、既存のオープンな700億パラメータモデルをも上回る結果となった」としている。
ライセンスは「Llama 2 Community License」に準拠しており、研究や商業目的での利用が可能。
ELYZA-japanese-Llama-2-13bを使ったチャット形式のデモもオープンソースAIプラットフォームの「Hugging Face hub」上で公開している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫
産業技術総合研究所と東京工業大学の研究チームは、日本語に強い大規模言語モデル(LLM)「Swallow」を公開した。 - マネーフォワード、大規模言語モデル「houou」公開 理研との共同研究 日本語の指示データ2900件を追加学習に利用
マネーフォワードは、理化学研究所(理研)と共同開発した大規模言語モデル(LLM)を公開した。出力精度を上げるため、日本語の指示データ(インストラクションデータ)2903件を追加学習に活用したのが特徴。 - 東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」
東京大学松尾研究室は、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。2024年、LLMの研究をさらに加速させるためチームを拡大するという。 - ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間
「ごみ出し案内」業務にはChatGPTを“活用しない”と決断──生成AIを使った業務効率化を検証してきた、香川県三豊市がそんな発表をした。実証実験には松尾研も協力したが、思ったような成果が出せなかったという。一体なぜか? - サイバーエージェント、再び大規模言語モデルを無料公開 3万2000トークンに対応 商用利用もOK
サイバーエージェントは、商用利用可能な日本語大規模言語モデルを無料公開した。