LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK

» 2023年08月14日 20時30分公開

[ITmedia]

　LINEは8月14日、日本語に特化した大規模言語モデル（LLM）「japanese-large-lm」を発表した。オープンソース（OSS）として公開し、商用利用も可能（Apache License 2.0）としている。

LINEが公開した「japanese-large-lm」の出力結果例

　公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大規模かつ高品質なデータ構築を行うため、OSSライブラリ「HojiChar」を使ったフィルタリング処理を実施。モデルの訓練には、LINE独自の大規模日本語Webコーパス（最終学習は約650GBのコーパスで実施）を利用したという。

　LINEは独自LLM「HyperCLOVA」の開発を長年手掛けているが、今回のモデルは別の開発ライン（LINEのMassive LM開発ユニット）にて構築したもの。同チームでは、指示文に対して適切な出力を行えるようにチューニングしたモデルを近日中に公開予定という。

Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開　他社上回る性能、商用利用も可能
英Stability AIの日本法人であるStability AI Japanは、日本語向け大規模言語モデル（LLM）「Japanese StableLM Base Alpha 7B」を公開した。パラメータは70億。ライセンスはApache License 2.0で、商用利用可能だ。
ChatGPT（3.5）に匹敵する「Llama 2」をローカルPCで動かしてみた
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。Llama 2ならば自宅のローカルPCでも動作させられるかもしれません。ということで、Text Generation web UIを使って、Llama 2を試してみました。
サイバーエージェント、日本語の大規模言語モデルを一般公開　最大68億パラメータ　商用利用可能
サイバーエージェントは最大68億パラメータの日本語LLM（大規模言語モデル）を一般公開した。ライセンスはCC BY-SA-4.0で、商用や研究目的で自由に利用できる。
「りんな」開発元、大規模言語モデルを公開　36億パラメーターで日本語特化
コミュニケーションAI「りんな」を提供するrinnaが、GPTベースの大規模言語モデルをオープンソースで公開した。日本語に特化した36億パラメーターを持つ汎用言語モデルと、対話言語モデルの2種類を用意する。
米Google、自然言語でAndroidデバイスを操作するための学習データセット公開
米Google Researchと米Google DeepMindに所属する研究者らは、Androidデバイスを自然言語で操作するための大規模な学習データセットを提案した研究報告を発表した。