サイバーエージェントが公開した大規模言語モデルの実力を試す:清水亮の「世界を変えるAI」(4/4 ページ)
5月16日、サイバーエージェントが商用利用可能な7B(68億パラメータ)の大規模言語モデルOpenCalm7Bを公開した。早速その実力を試してみた。
AIが事実と無関係な情報を出力してしまう、いわゆるハルシネーションはまだ多く見られるが、他のファンダメンタルモデルと違って途中で英語になったり、英語とまじって混乱したりしないため、日本語の文章をファインチューニングする際の土台として使えるのではないかと思う。
7B(68億パラメータ)のものを公開したというのも絶妙で、これはGoogle Colabでギリギリファインチューニング可能なサイズだ。
これをきっかけに国内のLLM(大規模言語モデル)コミュニティがさらに盛り上がり、今週中にはいくつものファインチューニングが出てくるだろうことが期待される。
海外では、例えば英国のStability.aiが画像生成モデルを商用利用可能で一般公開したことで世界的なムーブメントになった。大規模言語モデルでは、Databricks社やBigScience、Togerther Computing、スタンフォード大学などが商用利用可能なものを一般公開するなどの動きが相次いでいる。中国でも独自の大規模言語モデルを無償公開する例が多くある。しかし、日本国内ではこうしたオープンソースコミュニティへの貢献を行う会社がほぼ皆無であったことは誠に情けない次第だった。
しかし、こうした「(大規模計算資源を)持てるものの義務」を果たす会社が国内にも現れたことで、我が国における大規模言語モデルの研究が勢いづくことは間違いない。サイバーエージェントの今回の太っ腹な対応には素直に拍手を送りたい。
筆者プロフィール:清水 亮
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。2005年、IPA(情報処理推進機構)より「天才プログラマー/スーパークリエイタ」として認定。株式会社ゼルペム所属AIスペシャリスト。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。
関連記事
- 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
米OpenAIが独占的に提供する大規模言語モデル(LLM)に対し、さまざまなLLMが登場している。特に注目はオープンで自由な大規模言語モデル「Dolly-v2」だ。さながら現在は「不自由な大規模言語モデルと自由な大規模言語モデルの小競り合い」が起きている状態だ。 - 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
米OpenAIが独占的に提供する大規模言語モデル(LLM)に対し、さまざまなLLMが登場している。特に注目はオープンで自由な大規模言語モデル「Dolly-v2」だ。さながら現在は「不自由な大規模言語モデルと自由な大規模言語モデルの小競り合い」が起きている状態だ。 - 仕事で使うGPT-4実践テクニック 実際に「AIアートグランプリ」の事務局で使ってみた
第一回AIアートグランプリの興奮もさめやらぬなか、GPT-4があっさりと公開。せっかくなので、まずは第一回AIアートグランプリの報告書をGPT4にまとめてもらってみる。さらにChain of Thoughtでキャッチフレーズを考えさせるなど、事務局の仕事に活用してみた。 - なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方
OpenAIが2022年に発表した対話型AI「ChatGPT」の衝撃は、米国ビッグテック最強の一角であるGoogleを動揺させた。Googleは急ぎ「Bard」と名付けたチャットボットを投入し、巻き返しを図る。 - まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?
2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。
Copyright © ITmedia, Inc. All Rights Reserved.