1000億パラメータのLLM、AIスタートアップが公開　フルスクラッチで開発　「ハルシネーションを大幅抑止」

» 2024年05月16日 17時11分公開

　AIスタートアップ企業のストックマーク（東京都港区）は5月16日、1000億パラメータ規模の大規模言語モデル（LLM）を開発したと発表した。「Stockmark-LLM-100b」と名付けられたこのLMは、同社がフルスクラッチで開発したものでハルシネーション（AIがもっともらしいうそをつく現象）を大幅に抑えているのが特徴という。

AIスタートアップのストックマーク、1000億パラメータ規模の大規模言語モデルを開発

　同社は「公開されている既存のLLMモデルを用いずに、当社がフルスクラッチで開発した独自のLLM」と説明。独自に収集したビジネスドメインの日本語データを中心に事前学習させているため、日本語やビジネスドメイン、最新の時事話題に精通しているとしている。

　ハルシネーションを抑えるため、答えられない質問には無理に回答せず「分からない」と答えるという。同社は「厳密さが求められるビジネスシーンにおいても信頼して活用できるモデルの開発に成功した」とし、独自LLMの性能をアピールしている。

ハルシネーション抑止の例

「GPT-4-turbo」との出力結果の比較

　LLMのベンチマーク「VicunaQA Benchmark」の性能評価では、「Llama2（tokyotech-llm-Swallow-70b-instruct-hf）」と「GPT-3.5（text-davinci-003）」よりも高い点数を記録。推論速度を計測するために、100文字の日本語作文の生成速度を調べたところ、1.86秒を記録して「GPT-4-turbo」（5.48秒）を上回ったとしている。

「VicunaQA Benchmark」の性能評価

推論速度の計測結果

　Stockmark-LLM-100bは、事前学習済みモデルと、指示学習済みモデルをそれぞれHugging Face上で公開している。

経産省が生成AI開発支援　東大やSakana.aiなど採択　GoogleもGPU搭載スパコン提供
経済産業省とNEDOが、生成AIの開発支援事業に東大やSakana.aiなど採択。対象組織には、計算資源の利用料を補助するといった支援を行う。
NTTがAWSのLLM開発支援プログラムに参加　「H100」96基の提供受ける
AWSジャパンが、大規模言語モデル（LLM）の開発支援プログラム「AWS LLM開発支援プログラム」の成果報告会を開催した。これまでは非公開だったが、NTTがプログラムに参加していたことも明らかになった。
“純粋な国産AI”誕生　ハードもデータも全部日本製　スパコン「富岳」で開発
スーパーコンピュータ「富岳」で学習をした日本語特化の大規模言語モデルを開発した──東京工業大学と東北大学、富士通、理化学研究所、名古屋大学、サイバーエージェント、Kotoba Technologiesの合同研究チームは、そんな発表をした。
生成AIでGPUがいらなくなる？　業界を揺るがす「1ビットLLM」とは何か、識者に聞いた
米Microsoftの研究チームが発表した「BitNet」、通称「1bit LLM」と呼ばれる論文が波紋を呼んでいる。これまで必須だと思われていたGPUが不要で、CPUでもLLMが動作することを示唆している。そもそも“1bit”とは何が1bitなのか、どうして1bitになるとGPUが不要になるのか、AIソリューションの開発・提供を行うLaboro.AIの椎橋徹夫CEOに聞いた。
NTT、大規模言語モデル「tsuzumi」を提供開始　“鼓”奏者も演奏で祝福　LLM開発競争をどう戦う？
NTTは3月25日、独自の大規模言語モデル（LLM）「tsuzumi」の商用提供を始めた。記者発表会には、その名の由来である楽器“鼓”の奏者も駆け付け、祝言の演奏を披露した。