生成AIブームの今、注目のキーワードが「基盤モデル」だ。大量のデータを事前学習したAIモデルのことで、少しのチューニングを施せば、さまざまなタスクに対応できる。米OpenAIの「GPT-4」といった生成AIも包含する概念だ。
さまざまな企業が生成AIを使った業務効率化を試行錯誤する中、各AIベンダーたちの間では基盤モデルの開発競争が激化している。そこでこの特集では、基盤モデルを開発するAIベンダーに一問一答メールインタビューを実施。開発状況や独自の強みなどを探っていく。今回は、大規模言語モデル「tsuzumi」を開発し、3月に商用サービスを始めたNTTに聞いた。
特長としては下記4点である。
小型軽量であるためオンプレでも対応可能なものであり、心理的にクラウドであってもデータを外に出したくないという顧客に対応可能である。一方、小型軽量であるためチューニングは必要と考えており、基盤モデルをそのまま使うというよりも顧客と相談させていただき、それぞれに合った形で導入していきたい。
これまで自然言語研究を行ってきておりその成果をもとにNTT版のBERTの研究開発などを行ってきた。さらにtsuzumiはその技術を発展させて開発を行った。
上記の特長にある通り、小型軽量であるため下位のGPUでも動作可能であり、またオンプレでも動作可能である。また、柔軟なカスタマイズが可能である点と、例えば視覚相当の機能を用いて図表などを読み解き対応などのマルチモーダルである点が挙げられる。
NTTの研究所では長期的に音声認識や感情分析などさまざまなモーダルを研究開発しており、それぞれを搭載させ多種多様なニーズに対応できる。
tsuzumi発表会の様子はこちら
Copyright © ITmedia, Inc. All Rights Reserved.