LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK

LINEが、日本語に特化した大規模言語モデル「japanese-large-lm」を発表した。オープンソースとして公開し、商用利用も可能としている。

[ITmedia] PC用表示関連情報

LINE

Hatena

AI活用のいまが分かる

　LINEは8月14日、日本語に特化した大規模言語モデル（LLM）「japanese-large-lm」を発表した。オープンソース（OSS）として公開し、商用利用も可能（Apache License 2.0）としている。

LINEが公開した「japanese-large-lm」の出力結果例

　公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大規模かつ高品質なデータ構築を行うため、OSSライブラリ「HojiChar」を使ったフィルタリング処理を実施。モデルの訓練には、LINE独自の大規模日本語Webコーパス（最終学習は約650GBのコーパスで実施）を利用したという。

　LINEは独自LLM「HyperCLOVA」の開発を長年手掛けているが、今回のモデルは別の開発ライン（LINEのMassive LM開発ユニット）にて構築したもの。同チームでは、指示文に対して適切な出力を行えるようにチューニングしたモデルを近日中に公開予定という。

LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK

関連記事

関連リンク

LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK

関連記事

関連リンク

LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK