ニュース
NTT、大規模言語モデル「tsuzumi」開発 24年3月に商用サービス提供へ
NTTは、独自の大規模言語モデル「tsuzumi」を開発したと発表した。2024年3月に商用サービスとして提供を始める。
NTTは11月1日、独自の大規模言語モデル(LLM)「tsuzumi」を開発したと発表した。tsuzumiの特徴は「軽量でありながら世界トップレベルの日本語処理性能を持つこと」と同社は説明。2024年3月に商用サービスとして提供を始める。
tsuzumiでは、パラメータ数6億(超軽量版)と70億(軽量版)の2種類を用意。同社は「軽量版は1GPUで、超軽量版はCPUで高速に推論動作可能であり、チューニングや推論に必要なコストを抑えられる」と解説する。
NTTが試算したところ、GPUクラウドの利用料金への換算値では、学習コストは超軽量版で約300分の1、軽量版では25分の1に。推論コストは、超軽量版で約70分の1、軽量版で20分の1に軽減できたという。
tsuzumiは日本語と英語に対応。特に日本語処理性能は高く、生成AI向けのベンチマーク「Rakuda」ではGPT-3.5や他の国産LLMモデルを上回ったという。今後は、多言語やマルチモーダル(画像や言語など複数の入力ソースを扱えること)への対応も予定している。
同社はtsuzumiの商用サービスについて「まずは各業界に特化した領域にフォーカスする」と説明している。そのために、低遅延をうたう法人向け通信サービス「IOWN APN」を使った学習環境も構築。「数百km離れたデータセンター間でGPUとストレージを接続し、安全かつ性能低下の非常に少ないLLM学習環境を実現している」という。
関連記事
- 「世界トップレベルの大規模言語モデルの開発に着手」──産総研らが表明 目指すのは“GPT-3級の日本語LLM”
「世界トップレベルの大規模言語モデル(LLM)の開発を始める」──産業技術総合研究所は、そんな声明を発表した。 - NECの大規模言語モデルが一般初公開 現地の様子は
NECの自社製大規模言語モデル(LLM)が、テクノロジー展示会「CEATEC 2023」(10月17〜20日、幕張メッセ)で初の一般公開となった。会場から2時間程度たった正午ごろには、ブースに十数人程度の人だかりができる様子も。 - CTC、rinnaと協業 企業専用生成AIの構築支援を拡充
伊藤忠テクノソリューションズは、コミュニケーションAI「りんな」を提供するrinnaと協業すると発表した。 - PFNが生成AI新会社「Preferred Elements」設立へ 130億パラメータの和製LLMもオープンソースで公開
AIベンチャーのPreferred Networks(PFN)は、生成AI事業に関する新子会社「Preferred Elements」を11月1日に設立すると発表した。併せて、研究・商用利用が可能な、130億パラメータの事前学習済み大規模言語モデル(LLM)「PLaMo-13B」も公開した。 - 他人のSNS投稿を「GPT-4」に入力して個人情報を特定できるか? スイスの研究者らが検証
スイスのETH Zurichに所属する研究者らは、SNSに書き込んだテキストから大規模言語モデル(LLM)を用いて個人情報を推測できるかを検証した研究報告を発表した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.