検索
ニュース

「ドラクエX」が生成AIキャラクター導入へ Gemini 3 Flash活用の「おしゃべりスラミィ」

スクウェア・エニックスが、MMORPG「ドラゴンクエストX オンライン」(DQX)に、生成AIを活用した対話型パートナー機能「おしゃべりスラミィ」を導入する。GoogleのAIモデル「Gemini 3 Flash」とリアルタイム対話API「Gemini Live API」を組み合わせ、プレイヤーと音声で対話できるAIキャラクターを実現するという。

Share
Tweet
LINE
Hatena

 スクウェア・エニックスが、MMORPG「ドラゴンクエストX オンライン」(DQX)に、生成AIを活用した対話型パートナー機能「おしゃべりスラミィ」を導入する。GoogleのAIモデル「Gemini 3 Flash」とリアルタイム対話API「Gemini Live API」を組み合わせ、プレイヤーと音声で対話できるAIキャラクターを実現するという。Google Cloudが開催した説明会で発表し、デモを交えて詳細を披露した。

photo
Geminiを活用した対話型AIキャラクター「おしゃべりスラミィ」

 おしゃべりスラミィは、各プレイヤーにひもづく「相棒」として、ゲーム内で自由に会話できるAIキャラクターだ。自らを「死神見習い」と名乗り、プレイヤーによるプレイの履歴を「死神手帳」として記憶。プレイヤーとコミュニケーションを取ったり、ゲームをサポートしたりする。対話は音声とテキストの両方に対応する。

photo
デモ画面

 例えばプレイヤーが「どんな場所が好き?」とボイスで問いかけると、スラミィが「誰にも邪魔されず思索にふける隠れ家が好き」とキャラクター性のある回答を音声で返す。「何かおすすめ教えて」と聞くと、プレイヤーの進行状況に応じたクエストを具体的に提案する──といった具合だ。デモではスラミィがプレイヤーがゲームを始めた日や、ゲーム内で獲得できる称号の取得日を口にし、出会いを喜ぶ場面も披露した。

photo
スラミィが「死神手帳」をもとにおすすめコンテンツを提案する画面

 スラミィはプレイヤーの行動にも反応する。装備を変更すると自発的に話しかけてくるほか、スラミィ自身が衣装を変えて「どう思う?」と意見を求める場面もあった。定型文のチャットスタンプでスラミィとコミュニケーションすることも可能だ。AIに話しかけるハードルを下げる工夫という。

photo
チャットスタンプでもスラミィと会話できる

明かされたスラミィの裏側 カギはマルチエージェント構成

 スラミィの振る舞いを支えるのは、用途に応じて使うAIを切り替えるマルチエージェント構成だ。プレイヤーの質問内容に応じて、バトル専門のエージェントやクエスト専門のエージェントを自動で切り替える仕組みになっている。

 スクウェア・エニックスの荒牧岳志さん(AI&エンジン開発ディビジョン ジェネラル・マネージャー)によれば、処理の流れは大きく4段階に分かれる。まずプレイヤーの発話を受け取ると、バトルやクエストなどどの領域に該当するかを判定し、適切なエージェントに振り分ける。

 次にそのエージェントがゲーム内データベースから領域ごとに特化した情報を取得して回答を生成する。3段階目で口調の制御が入り、スラミィ独特の語尾(「デスら」など)の付加や文字数の制限を行う。最後にボイスを生成し、プレイヤーに音声で返す。

photo
処理のイメージ

 荒牧さんによると、世界観を維持するための制御は3段階目の口調制御の工程が担っている。「こういうことは言ってはいけない」というリストを用意し、ゲーム外の話題には応答しないよう判定する仕組みも別途設けた。

photo
スクウェア・エニックスの荒牧岳志さん

 また、スラミィが持つ知識の範囲はDQXの舞台「アストルティア」の中に限られている。現実世界の話題を振っても「何のこと?」と返す設計だ。例えば「アメリカの大統領は誰?」と聞いても、スラミィはゲーム世界の住人として反応するという。ハルシネーション軽減に向けたガードレールの実装はGoogle Cloudも支援した。

 会話の文脈を保つ仕組みとして、メモリ機能も備える。1日分の会話履歴を保存し、AIがプレイヤーの好みや話題の傾向を学習する。加えて、プレイヤーのゲーム内行動ログも参照しており、「このクエストをクリアした」といった情報を踏まえた応答を返せる。前述した「死神手帳」の演出は、このログ参照の仕組みに基づいている。

 一方で、他のプレイヤーとの会話データは参照しない。荒牧さんは「お互いの会話はそのご主人(プレイヤー)とだけ」と述べ、プライバシーへの配慮を強調した。

 Google Cloudのジャック・ビューザーさん(ゲーム担当グローバルディレクター)によれば、Gemini 3 FlashとLive APIの採用は、低遅延のマルチモーダル対話を実現するための判断だ。Live APIはプレイヤーの言語を理解しつつ、ゲームプレイの画面も認識できるマルチモーダル仕様。「AIバディを友達として感じるには、やりとりが瞬時に行われる必要がある」(ビューザーさん)という。

photo
Google Cloudのジャック・ビューザーさん
photo
技術選定の背景

 DQXのショーランナー(運営・開発の総責任者)を務める安西崇さんは、スラミィの将来にも触れた。特別な場所で他のプレイヤーのスラミィが見えたり、スマートフォンでスラミィを見せ合ったりする遊びも考えているという。ただし「夢はいっぱいあるが、できるのはだいぶ先。まずは相棒・友達というところから」と、段階的に進める考えだ。

 Google Cloudは、おしゃべりスラミィをモデルケースに他業界のAI活用も推進したい考えだ。例えばゲーム内のAIバディを動かす仕組みは、小売業での接客エージェントにも応用できると見立てを示した。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る