ニュース
LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK
LINEが、日本語に特化した大規模言語モデル「japanese-large-lm」を発表した。オープンソースとして公開し、商用利用も可能としている。
LINEは8月14日、日本語に特化した大規模言語モデル(LLM)「japanese-large-lm」を発表した。オープンソース(OSS)として公開し、商用利用も可能(Apache License 2.0)としている。
公開したLLMは、36億パラメーターと17億パラメーターの2つ。両モデルともHuggingFace Hubからアクセスできる。Web由来のテキストから大規模かつ高品質なデータ構築を行うため、OSSライブラリ「HojiChar」を使ったフィルタリング処理を実施。モデルの訓練には、LINE独自の大規模日本語Webコーパス(最終学習は約650GBのコーパスで実施)を利用したという。
LINEは独自LLM「HyperCLOVA」の開発を長年手掛けているが、今回のモデルは別の開発ライン(LINEのMassive LM開発ユニット)にて構築したもの。同チームでは、指示文に対して適切な出力を行えるようにチューニングしたモデルを近日中に公開予定という。
関連記事
- Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能
英Stability AIの日本法人であるStability AI Japanは、日本語向け大規模言語モデル(LLM)「Japanese StableLM Base Alpha 7B」を公開した。パラメータは70億。ライセンスはApache License 2.0で、商用利用可能だ。 - ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動かしてみた
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。Llama 2ならば自宅のローカルPCでも動作させられるかもしれません。ということで、Text Generation web UIを使って、Llama 2を試してみました。 - サイバーエージェント、日本語の大規模言語モデルを一般公開 最大68億パラメータ 商用利用可能
サイバーエージェントは最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した。ライセンスはCC BY-SA-4.0で、商用や研究目的で自由に利用できる。 - 「りんな」開発元、大規模言語モデルを公開 36億パラメーターで日本語特化
コミュニケーションAI「りんな」を提供するrinnaが、GPTベースの大規模言語モデルをオープンソースで公開した。日本語に特化した36億パラメーターを持つ汎用言語モデルと、対話言語モデルの2種類を用意する。 - 米Google、自然言語でAndroidデバイスを操作するための学習データセット公開
米Google Researchと米Google DeepMindに所属する研究者らは、Androidデバイスを自然言語で操作するための大規模な学習データセットを提案した研究報告を発表した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.