Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開　他社上回る性能、商用利用も可能

英Stability AIの日本法人であるStability AI Japanは、日本語向け大規模言語モデル（LLM）「Japanese StableLM Base Alpha 7B」を公開した。パラメータは70億。ライセンスはApache License 2.0で、商用利用可能だ。

[松浦立樹，ITmedia] PC用表示関連情報

LINE

Hatena

AI活用のいまが分かる

　英Stability AIの日本法人であるStability AI Japan（東京都渋谷区）は8月10日、日本語特化の大規模言語モデル（LLM）「Japanese StableLM Base Alpha 7B」を公開した。パラメータ数は70億。ライセンスはApache License 2.0で、商用利用可能だ。

Stability AI Japan、日本語特化の大規模言語モデル「Japanese StableLM Base Alpha 7B」を公開

　LLMの性能評価ツール「lm-evaluation-harness」で調べたところ、サイバーエージェントやrinnaが公開している日本語LLMよりも高スコアを記録した。学習には、LLM学習のためのライブラリ「GPT-NeoX」をアレンジしたものなどを利用しており、学習したトークンは延べ7500億に及ぶ。

性能評価の比較表

　また、このモデルに追加学習を行い、ユーザーの指示に受け答えできるようにしたモデル「Japanese StableLM Instruct Alpha 7B」も併せて公開。このモデルでは「西郷隆盛はどんな人物ですか？」などの質問に受け答えできる。性能評価はBaseモデルよりもさらに高いが、商用利用はできず、用途は研究目的での利用に限定している。

「Japanese StableLM Instruct Alpha 7B」の受け答えの例

　どちらのモデルもHugging Faceからダウンロードできる。

Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開　他社上回る性能、商用利用も可能

関連記事

関連リンク

Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能

関連記事

関連リンク

Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開　他社上回る性能、商用利用も可能