サイバーエージェント、最大68億パラメータの日本語による大規模言語モデルを公開

サイバーエージェントは、最大68億パラメータの日本語による大規模言語モデル（LLM）を一般公開した。既存LLMの多くは英語を中心に学習されているため、日本語や日本文化に強いLLMは少ない状況を打破する狙いがある。

LINE

Hatena

　サイバーエージェントは2023年5月17日、最大68億パラメータの日本語による大規模言語モデル（LLM）を一般公開した。

　サイバーエージェントによると、「ChatGPT」をはじめとする生成AI（人工知能）を活用したサービスは急速な進化を遂げており、全世界中の多くの業界やビジネスで利用が促進されている。しかし、既存のLLMのほとんどは英語を中心に学習されているため、日本語や日本文化に強いLLMは少ない。今回のLLMの開発および公開はこうした背景を受けたものだ。

サイバーエージェントは最大68億パラメータの日本語LLMを一般公開した（出典：サイバーエージェントのWebサイト）

最大68億パラメータの日本語LLMで提供　今後の活用方法は？

　サイバーエージェントは今回公開した日本語LLMの一部モデルを、ML（機械学習）プロジェクトのデモを共有できるプラットフォーム「Hugging Face Hub」で公開した。公開されたモデルは「Wikipedia」や「Common Crawl」といったオープンな日本語データで学習したもので、商用利用可能な「CC BY-SA 4.0ライセンス」で提供される。

　サイバーエージェントは、公開されたモデルをユーザー側でチューニングをすることで、対話型AIなどの開発が可能になる。これによって、より多くの企業や組織が日本語の自然言語処理に関する最先端の研究開発に取り組めるようになるという。

　同社は今後、これまで培った知見を生かして、チャットbotやRPAをはじめとする業界特化型のLLMの構築や各企業と連携したLLMを活用したビジネス開発の推進などを予定している。また、LLMを活用したビジネス開発に携わるエンジニアの新規採用を実施し、体制強化も図る。

関連情報

ChatGPTで“ググる”は死語になる？　AI研究者の松尾豊氏が予測する未来
最近各所で話題を集めるChatGPT。今後、これが進化していくことで生活やビジネスにどのような変化を巻き起こすのだろうか。AI研究の第一人者である松尾豊氏が“ChatGPTという現象”を分析した。
生成AIの企業利用はどうなる？　ガイドライン整備を急ぐ日本の状況
生成AIの利用促進に向けて、現行法の解釈やリスクを企業がどう判断すべきかを示したガイドラインが公開されました。現在議論されているリスクと国際的な「温度感」はどうなっているのでしょうか。
GoogleがいよいよAI開発に本気？　LLM関連の新技術発表の臆測
Googleの次の開発者向けイベントの中心テーマは人工知能（AI）で、新しい大規模言語モデルなどが発表される予定だとの報道が出た。Bardの日本語拡張の可能性も指摘されている。
生成AIブームの裏にひそむ「AIリスク」　ハーバード大で起業した日本人経営者が語る“AIとの向き合い方”
生成AIをはじめとするAIモデルのリスクや法整備を含む社会の動向、日本企業のAI管理の事例について、「AIリスク」分野の専門家に聞いた。

サイバーエージェント、最大68億パラメータの日本語による大規模言語モデルを公開

最大68億パラメータの日本語LLMで提供　今後の活用方法は？

関連記事

関連リンク

サイバーエージェント、最大68億パラメータの日本語による大規模言語モデルを公開

最大68億パラメータの日本語LLMで提供 今後の活用方法は？

関連記事

関連リンク

最大68億パラメータの日本語LLMで提供　今後の活用方法は？