NTTが作った基盤モデルの特徴は? 大規模言語モデル「tsuzumi」についてメールインタビュー
生成AIブームの今、注目のキーワードが「基盤モデル」だ。大量のデータを事前学習したAIモデルのことで、少しのチューニングを施せば、さまざまなタスクに対応できる。米OpenAIの「GPT-4」といった生成AIも包含する概念だ。
さまざまな企業が生成AIを使った業務効率化を試行錯誤する中、各AIベンダーたちの間では基盤モデルの開発競争が激化している。そこでこの特集では、基盤モデルを開発するAIベンダーに一問一答メールインタビューを実施。開発状況や独自の強みなどを探っていく。今回は、大規模言語モデル「tsuzumi」を開発し、3月に商用サービスを始めたNTTに聞いた。
NTTの基盤モデルの特徴や強みは何か?
特長としては下記4点である。
- 小型軽量である(70億パラメーター)
- 長年の言語研究のノウハウがつまっており、特に日本語に強い
- 小型軽量であるため柔軟なチューニングが可能
- 視覚読解や音声関連技術などと組み合わせたマルチモーダル
基盤モデルで解決できる業務課題にはどのようなものがあるか?
小型軽量であるためオンプレでも対応可能なものであり、心理的にクラウドであってもデータを外に出したくないという顧客に対応可能である。一方、小型軽量であるためチューニングは必要と考えており、基盤モデルをそのまま使うというよりも顧客と相談させていただき、それぞれに合った形で導入していきたい。
なぜ基盤モデルの開発を決めたのか?
これまで自然言語研究を行ってきておりその成果をもとにNTT版のBERTの研究開発などを行ってきた。さらにtsuzumiはその技術を発展させて開発を行った。
他社と比較した際、競合有意性はどこにあるのか?
上記の特長にある通り、小型軽量であるため下位のGPUでも動作可能であり、またオンプレでも動作可能である。また、柔軟なカスタマイズが可能である点と、例えば視覚相当の機能を用いて図表などを読み解き対応などのマルチモーダルである点が挙げられる。
NTTの研究所では長期的に音声認識や感情分析などさまざまなモーダルを研究開発しており、それぞれを搭載させ多種多様なニーズに対応できる。
tsuzumi発表会の様子はこちら
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
LINEヤフー、AI強化へ若手エンジニア募集 新卒・第二新卒、給与に一律の上限なし
-
2
NEC、富士通に先手!? 日立が「Claude Mythos」アクセス権を取得した背景
-
3
「性能低下」によりNotion AIで「Claude」一時選択不可に 原因は「サービス障害」
-
4
「AI=質問」は遅れてる エージェント型AI「Claude Cowork」、組織展開に向けた管理機能を拡充
-
5
“AIでAIを開発”加速へ Sakana AI 「計算資源の量ではなく、アイデアで進歩」
-
6
東大松尾研が「LLM講座 基礎編」の講義資料を無料公開 期間限定で
-
7
人型ロボブームを“先駆者ホンダ”はどう見る? 「悔しさもあるが……」 次の一手を聞いた
-
8
2年間で「1万時間」削減 「1円の誤りも許されない」ソニー経理が“まず試してみる”DX集団に化けたワケ
-
9
Google Chromeの新機能「Skills」 AIプロンプトの“毎回手打ち”を不要に
-
10
AIコスト高騰で中国DeepSeekへの“乗り換え”続出か 米国決済サービスの支出調査で明らかに
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR