LINEは8月14日、日本語に特化した大規模言語モデル(LLM)「japanese-large-lm」を発表した。オープンソース(OSS)として公開し、商用利用も可能(Apache License 2.0)としている。
公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大規模かつ高品質なデータ構築を行うため、OSSライブラリ「HojiChar」を使ったフィルタリング処理を実施。モデルの訓練には、LINE独自の大規模日本語Webコーパス(最終学習は約650GBのコーパスで実施)を利用したという。
LINEは独自LLM「HyperCLOVA」の開発を長年手掛けているが、今回のモデルは別の開発ライン(LINEのMassive LM開発ユニット)にて構築したもの。同チームでは、指示文に対して適切な出力を行えるようにチューニングしたモデルを近日中に公開予定という。
Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能
ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動かしてみた
サイバーエージェント、日本語の大規模言語モデルを一般公開 最大68億パラメータ 商用利用可能
「りんな」開発元、大規模言語モデルを公開 36億パラメーターで日本語特化
米Google、自然言語でAndroidデバイスを操作するための学習データセット公開Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR