ITmedia NEWS > 速報 >
ニュース
» 2020年11月25日 16時00分 公開

LINE、日本語特化の汎用言語モデル開発へ 100億ページ分のデータを学習

LINEが、日本語に特化した汎用言語モデルを開発する。日本語データを100億ページ分学習させ、対話や翻訳、文章作成などができるAIを作る。

[谷井将人,ITmedia]

 LINEは11月25日、日本語に特化した汎用(はんよう)言語モデルを開発すると発表した。新聞記事や小説などのさまざまな言語データを100億ページ分学習させ、対話や文章生成などができるAIを作る。

photo LINEのWebサイト

 まずは、韓国NAVERと共同で700ペタFLOPSの性能を持つスーパーコンピュータを活用し、学習や処理に必要なインフラを年内に整備する。汎用言語モデルには1750億個以上のパラメータを設定する予定。これは、イーロン・マスク氏が共同会長を務める非営利のAI研究企業、米OpenAIが6月に発表した汎用言語モデル「GPT-3」と同等以上の数字となる。

 汎用言語モデルとは、膨大な言語データを学習して、対話や翻訳に加え、文章生成やプログラミングなど、さまざまな言語処理を行うAIのこと。文章の冒頭が1文入力されただけで文章全体を生成したり、要件定義をするだけでプログラムを構築したりする機能を持つものもある。

 汎用言語モデルの分野ではOpenAIや米Googleなどが先行しており、英語以外に特化したものはごく少数という。LINEは「日本語に特化した超巨大言語モデル開発は世界でも初」としている。

photo OpenAIの研究

 開発したモデルは、対話AIの開発や検索サービスの品質向上、同社のAI技術「LINE CLOVA」への活用などを見込む。他社との共同開発やAPIの提供についても検討するとしている。

Copyright © ITmedia, Inc. All Rights Reserved.