rinna、日本語に特化した「GPT-2」の言語モデルをオープンソース化　学習済みモデルも公開

» 2021年04月08日 14時27分公開

[ITmedia]

　日本マイクロソフトのチャットbot事業を分社化したrinna（東京都渋谷区）は4月7日、日本語に特化した「GPT-2」の言語モデルをオープンソース化した。製品開発に向けた実験のために構築したもので、「GitHub」や自然言語処理モデルのライブラリ「HuggingFace」で公開している。

　GPT-2は、AI研究企業の米OpenAIが提供する言語モデル。「人間が使う言葉らしさ」を確率にしたもので、ある単語や文が与えられたときに、次に来る確率が高い自然な単語を推定するという。米NvidiaのGPU「Tesla V100」を使い、70GBの日本語テキストを約1カ月かけてトレーニングさせたため、高度な日本語の文章を生成できるとしている。

生成したテキスト

　rinnaは今後、パラメータの数やトレーニングさせたデータが異なるモデルも公開するとしている。

AIチャットbotを200件のデータで構築　従来の60分の1に　「りんな」開発元が新技術
rinnaが、キャラクター性を持ったAIチャットbotを開発するサービス「Rinna Character Platform」に新しい会話エンジンを採用。必要な学習データを従来の1万2000件から約200件に削減した。
日本MSから独立した“元女子高生AI”「りんな」、新会社rinnaで事業スタート
日本マイクロソフトのチャットbot事業を分社化した新会社・rinnaが業務をスタート。“元女子高生AI”をうたうチャットbot「りんな」などの事業を引き継ぎ、日本で要望が多かったカスタマイズのサービスなどを提供する。
米Microsoft、日本MSの「りんな」を含むチャットbot事業を分社化
米Microsoftはが、日本の「りんな」を含むチャットbot関連事業を分社化すると発表した。
キーワードから小説や画像を自動生成　自然言語処理の革命児「GPT-3」の衝撃
「GPT-3」「OpenAI」というキーワードが人工知能界隈で飛び交っている。これはいったい何なのか、どこがすごいのか、探ってみた。