サイバーエージェント、最大68億パラメータの日本語による大規模言語モデルを公開

サイバーエージェントは、最大68億パラメータの日本語による大規模言語モデル(LLM)を一般公開した。既存LLMの多くは英語を中心に学習されているため、日本語や日本文化に強いLLMは少ない状況を打破する狙いがある。

» 2023年05月18日 07時00分 公開
[田渕聖人ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 サイバーエージェントは2023年5月17日、最大68億パラメータの日本語による大規模言語モデル(LLM)を一般公開した。

 サイバーエージェントによると、「ChatGPT」をはじめとする生成AI(人工知能)を活用したサービスは急速な進化を遂げており、全世界中の多くの業界やビジネスで利用が促進されている。しかし、既存のLLMのほとんどは英語を中心に学習されているため、日本語や日本文化に強いLLMは少ない。今回のLLMの開発および公開はこうした背景を受けたものだ。

サイバーエージェントは最大68億パラメータの日本語LLMを一般公開した(出典:サイバーエージェントのWebサイト)

最大68億パラメータの日本語LLMで提供 今後の活用方法は?

 サイバーエージェントは今回公開した日本語LLMの一部モデルを、ML(機械学習)プロジェクトのデモを共有できるプラットフォーム「Hugging Face Hub」で公開した。公開されたモデルは「Wikipedia」や「Common Crawl」といったオープンな日本語データで学習したもので、商用利用可能な「CC BY-SA 4.0ライセンス」で提供される。

 サイバーエージェントは、公開されたモデルをユーザー側でチューニングをすることで、対話型AIなどの開発が可能になる。これによって、より多くの企業や組織が日本語の自然言語処理に関する最先端の研究開発に取り組めるようになるという。

 同社は今後、これまで培った知見を生かして、チャットbotやRPAをはじめとする業界特化型のLLMの構築や各企業と連携したLLMを活用したビジネス開発の推進などを予定している。また、LLMを活用したビジネス開発に携わるエンジニアの新規採用を実施し、体制強化も図る。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ