AIが事実と無関係な情報を出力してしまう、いわゆるハルシネーションはまだ多く見られるが、他のファンダメンタルモデルと違って途中で英語になったり、英語とまじって混乱したりしないため、日本語の文章をファインチューニングする際の土台として使えるのではないかと思う。
7B(68億パラメータ)のものを公開したというのも絶妙で、これはGoogle Colabでギリギリファインチューニング可能なサイズだ。
これをきっかけに国内のLLM(大規模言語モデル)コミュニティがさらに盛り上がり、今週中にはいくつものファインチューニングが出てくるだろうことが期待される。
海外では、例えば英国のStability.aiが画像生成モデルを商用利用可能で一般公開したことで世界的なムーブメントになった。大規模言語モデルでは、Databricks社やBigScience、Togerther Computing、スタンフォード大学などが商用利用可能なものを一般公開するなどの動きが相次いでいる。中国でも独自の大規模言語モデルを無償公開する例が多くある。しかし、日本国内ではこうしたオープンソースコミュニティへの貢献を行う会社がほぼ皆無であったことは誠に情けない次第だった。
しかし、こうした「(大規模計算資源を)持てるものの義務」を果たす会社が国内にも現れたことで、我が国における大規模言語モデルの研究が勢いづくことは間違いない。サイバーエージェントの今回の太っ腹な対応には素直に拍手を送りたい。
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。2005年、IPA(情報処理推進機構)より「天才プログラマー/スーパークリエイタ」として認定。株式会社ゼルペム所属AIスペシャリスト。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR