NTT、大規模言語モデル「tsuzumi」開発　24年3月に商用サービス提供へ

NTTは、独自の大規模言語モデル「tsuzumi」を開発したと発表した。2024年3月に商用サービスとして提供を始める。

LINE

Hatena

　NTTは11月1日、独自の大規模言語モデル（LLM）「tsuzumi」を開発したと発表した。tsuzumiの特徴は「軽量でありながら世界トップレベルの日本語処理性能を持つこと」と同社は説明。2024年3月に商用サービスとして提供を始める。

　tsuzumiでは、パラメータ数6億（超軽量版）と70億（軽量版）の2種類を用意。同社は「軽量版は1GPUで、超軽量版はCPUで高速に推論動作可能であり、チューニングや推論に必要なコストを抑えられる」と解説する。

　NTTが試算したところ、GPUクラウドの利用料金への換算値では、学習コストは超軽量版で約300分の1、軽量版では25分の1に。推論コストは、超軽量版で約70分の1、軽量版で20分の1に軽減できたという。

軽量によるコストメリットの例

　tsuzumiは日本語と英語に対応。特に日本語処理性能は高く、生成AI向けのベンチマーク「Rakuda」ではGPT-3.5や他の国産LLMモデルを上回ったという。今後は、多言語やマルチモーダル（画像や言語など複数の入力ソースを扱えること）への対応も予定している。

日本語性能に関するtsuzumiと他LLMとの対戦結果

視覚的読解技術の実施例

　同社はtsuzumiの商用サービスについて「まずは各業界に特化した領域にフォーカスする」と説明している。そのために、低遅延をうたう法人向け通信サービス「IOWN APN」を使った学習環境も構築。「数百km離れたデータセンター間でGPUとストレージを接続し、安全かつ性能低下の非常に少ないLLM学習環境を実現している」という。

NTT、大規模言語モデル「tsuzumi」開発　24年3月に商用サービス提供へ

関連記事

関連リンク

NTT、大規模言語モデル「tsuzumi」開発 24年3月に商用サービス提供へ

関連記事

関連リンク

NTT、大規模言語モデル「tsuzumi」開発　24年3月に商用サービス提供へ