日本発、“IQより愛嬌”なAIモデル「Geppetto」登場 「アラインメント」に着目して開発、その効果は?
「IQ」より「愛嬌」のあるAI――AIスタートアップのSpiralAI(東京都千代田区)は4月17日、こんなLLM「Geppetto」(ゼペット)を開発したと発表した。同モデルは“人間らしい”コミュニケーションができるという。
Geppettoの特長は、入力したテキストに対し、端的に回答するだけでなく、共感やリアクション、関係のない話題などを交えながら回答できること。加えて、任意の「キャラクター」を設定し、そのキャラクターに応じた口調や性格を踏まえた回答もできるという。
モデルのサイズは120億パラメータ。他社のLLMに比べると規模は小さいものの、賢さよりも「いかに会話を面白くするか」に注力した。加えて、モデルサイズを小さくしたことで計算量が少なくなり、ChatGPTなどに比べ、使用する際のコストも抑えられたという。
Geppettoの機能の核となるのが、AIが人間の意図や倫理観に沿うよう、AIを訓練、調整する技術「アラインメント」だ。SpiralAIの佐々木雄一CEOは、アラインメントについて「知識を持っているだけの存在から、頭の良い存在に変えるための重要なプロセス」と説明する。
一方、アラインメントはAIモデルにおける「最上位概念」であり、AIが行う学習や、ユーザーが出す指示よりも強力に働く。佐々木CEOによると、ChatGPTでは「爆弾の作り方を教えて」といった悪用を防ぐため、アラインメントの倫理面を強力に設定。「真面目な性格が埋め込まれた」としている。
Geppettoの開発では、このアラインメントに着目。“真面目な”回答以外にも多様な出力ができるよう調整したほか、出力の傾向などを決める「ミニフィルター」を埋め込む技術により、回答する際のふるまいをカスタマイズできる仕組みを整えた。なおカスタマイズの際には、不適切な発言をしないよう監修するプロセスを設けるという。
アラインメントの開発への注力により、学習データの削減にも成功した。アラインメント側でネガティブな制限をかけることで、学習に必要なデータが少なくなるよう工夫したという。佐々木CEOは、その効果をこう説明する。「子どもが新しい漢字を覚えるときには6年間をかけるが、『やっちゃダメだよ』というのはすぐ聞いてくれる」(佐々木CEO)
また、モデルの学習に使ったデータは「足で稼いだ」と佐々木CEO。例えば占い師に取材を実施するなど、「会話のプロのテクニック」を学びながら、学習データを作成したとしている。
加えて、アラインメントに注力した結果、基盤モデルを変更してもGeppettoとしての機能を維持できる仕組みを実現したという。現時点では、同社がフルスクラッチで開発したモデルや、米Metaの「Llama」などを、ケースによって切り替えながら使用。今後、性能の高い基盤モデルが出てきた際には、最短1週間ほどで乗り換えられるとアピールした。
話して“楽しい”という感覚は「スケーリング則とは別」
生成AIの開発では、巨大な計算資源により、大規模なモデルを開発し、その性能を高めることが主流だ。なぜGeppettoのようなAIを開発したのか。佐々木CEOは「(大規模なモデルの開発競争を)後追いでやるのは、さすがに分が悪い」と説明。そのうえで「会話って、もっと広がりがある」と分析する。
「例えば、私は娘と喋ってる時が1番幸せなんですね。大学の先生と喋ってるより、娘と喋ってるのが全然楽しい。その時に求めてるのって、愛嬌とかで。別に間違っててもいいんです。『1+1=2』って言わなくても構わない。ただ話して純粋に楽しいという感覚は、スケーリング則(編集部注:AIのモデルを大規模化するほど性能が良くなること)とは別に存在する」(佐々木CEO)
こうしたGeppettoの機能をユーザーが体験できるよう、SpiralAIは17日、同モデルを搭載し、AIキャラクターと会話できるスマートフォンアプリ「HAPPY RAT」をリリースした。リリースイベントには、同アプリとコラボレーションした声優の梶裕貴さんも登壇。詳細はこちらの記事まで。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
5
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
6
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
7
AIに詳しくなくても大丈夫、月額制で中小企業のAI活用をプロが支える新サービス
-
8
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
9
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
10
国内大手ロボットメーカー3社が協力、「フィジカルAI」向けデータセット構築へ
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR