ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

NTT、大規模言語モデル「tsuzumi」開発 24年3月に商用サービス提供へ

» 2023年11月01日 12時55分 公開
[松浦立樹ITmedia]

 NTTは11月1日、独自の大規模言語モデル(LLM)「tsuzumi」を開発したと発表した。tsuzumiの特徴は「軽量でありながら世界トップレベルの日本語処理性能を持つこと」と同社は説明。2024年3月に商用サービスとして提供を始める。

 tsuzumiでは、パラメータ数6億(超軽量版)と70億(軽量版)の2種類を用意。同社は「軽量版は1GPUで、超軽量版はCPUで高速に推論動作可能であり、チューニングや推論に必要なコストを抑えられる」と解説する。

 NTTが試算したところ、GPUクラウドの利用料金への換算値では、学習コストは超軽量版で約300分の1、軽量版では25分の1に。推論コストは、超軽量版で約70分の1、軽量版で20分の1に軽減できたという。

軽量によるコストメリットの例

 tsuzumiは日本語と英語に対応。特に日本語処理性能は高く、生成AI向けのベンチマーク「Rakuda」ではGPT-3.5や他の国産LLMモデルを上回ったという。今後は、多言語やマルチモーダル(画像や言語など複数の入力ソースを扱えること)への対応も予定している。

日本語性能に関するtsuzumiと他LLMとの対戦結果
視覚的読解技術の実施例

 同社はtsuzumiの商用サービスについて「まずは各業界に特化した領域にフォーカスする」と説明している。そのために、低遅延をうたう法人向け通信サービス「IOWN APN」を使った学習環境も構築。「数百km離れたデータセンター間でGPUとストレージを接続し、安全かつ性能低下の非常に少ないLLM学習環境を実現している」という。

Copyright © ITmedia, Inc. All Rights Reserved.