NTTドコモは1月17日〜18日に技術イベント「docomo Open House'24」を東京国際フォーラムで開催した。通信以外にも幅広い分野に渡る技術展示の中で、とりわけ大々的に展示されたのが、メタバースと生成AIに関する取り組みだ。
「メタバース空間に、にぎわいを増やしたい」と話すのは、ドコモでメタバースの研究開発に携わる林雄太氏だ。ドコモグループではDoorとMetaMeという2つのメタバースサービスを運営しているが、人のにぎわいが乏しく「過疎バースとやゆされることもある」という。
ビデオゲームでおなじみのNPC(ノンプレイヤーキャラクター)を、メタバース空間に増やしたいという取り組みだ。ドコモでは世界初という、生成AIでNPCを作る技術を開発した。
NPCは、プレイヤーではない脇役的なキャラクターで、あらかじめ決められたルールに従って動く。コンピュータゲームではNPCは一般的な存在だが、メタバースではNPCを見かけることは少ない。NPCにあった動きのパターン(行動ロジック)をプログラミングする必要があるためだ。
3Dゲームの人気作では、多くの人手をかけて行動ロジックを設定しているが、メタバースで同様にNPCを製作するのは難しい。ユーザーが空間を制作したり、非ゲーム企業が空間を演出したりすることもあるメタバースでは、制作に使える資源が限られている。そのため、“過疎バース”と呼ばれてしまうような、動くキャラクターが少ないメタバース空間が生じてしまいがちだ。
そこでドコモは、生成AIでNPC制作を自動化するシステムを開発している。
この新しい技術では、NPCの動きを自然言語(英語)で指示すると、行動ロジックを自動で出力する。例えば「メタバース空間をぐるぐる散歩して、プレイヤーが来たらあいさつする」といった動きの指示文を与えると、生成AIが行動ロジックを解釈して、それに対応する一連のコードを「ビヘイビアツリー」の形で出力する。
この技術の特徴は、文章で与えた指示をLLM(大規模言語モデル)が分析し、より具体的なタスクに分割してからロジックツリーを構築するという多層的な構造で処理を行うことだ。
生成AIを巡っては、文章から3Dキャラクターを自動生成するAIや、キャラクターのアニメーションを自動生成するAIの研究も進んでいる。
ドコモは今回開発したロジックツリーを生成するAIモデルと、外観やアニメーションを生成するAIモデルを組み合わせて、「文章で指示するだけでNPCが自動生成される」モデルの開発を目指している。
従来技術ではNPCを10体作成するためのプログラミングで約42時間かかるが、ドコモの技術を用いると1時間程度に短縮可能となるという。
2つのメタバース空間を横断して操作する技術も展示していた。
ドコモと関連のあるメタバースサービスは2つある。1つは子会社のNTT CONOQが運営する「Door」。もう1つはRelicが運営する「MetaMe(メタミー)」だ。
MetaMeは、スマホで接続できるメタバースで、2023年3月にβ版としてサービスを開始した。最大1万人の同時接続を特徴としており、香川県琴平町や、通販企業のQVCとコラボレーションしたバーチャル空間を提供している。
docomo Open House'24では、MetaMe関連の技術展示が複数展示されていたが、その中に「MetaMeからDoorのワールドに接続する」という展示があった。
これは、MetaMeにログインしたプレイヤーが、別のアプリを立ち上げずに、そのままDoorの仮想空間に遷移するという仕組みだ。MetaMeのユーザーにとっては、Doorのバーチャル空間へとアプリを開き直さずに移動できて、コントローラーなどの操作体系についても変えずに操作できる。
MetaMeはスマホのブラウザでも動作する軽量なXRサービスだが、ワールドが限られていて、遊びの幅が狭い。一方で、Doorはワールド数が多いが、端末側の負荷が高く、性能が高くないスマホのブラウザでは動作が遅くなるという弱点がある。そこで、2つのメタバースを連携させようというのがこの試みに至った経緯だ。
このシステムでは、MetaMeのシステム上で、Doorから画面表示を受信し、操作信号を中継する。Doorの画面の表示はクラウド上に配備されたGPUで行うため、スマホ側の画像処理の負荷が抑えられる。このシステムでは、受け入れ先のDoor上では一般ユーザーと同じ扱いとなる。つまり、特別な技術的な対応を行う必要はなく、受け入れられる。
このメタバースから他のメタバースを操作するという仕組みを使うと、NPCを製作する負荷も減らせる。これまでメタバースサービス毎に最適していたNPCを、1つのメタバース向けに製作して、配備できるという。
例えば、メタバース内のバーチャル博物館を作り、そこに説明員としてNPCを置くような場合に、MetaMe向けに製作したNPCを、Doorの空間に持ち込んでそのまま利用できる。
こうしたNPCの動作では画面表示も必要ではないため、GPU処理の費用も現実的な範囲に抑えられる。1体のNPUを24時間動かした場合で、1カ月に40ドル程度の費用で動作可能だという。
将来的に複数のメタバースが並立して、その間を行き来するような使い方が当たり前になったときに、こうした中継システムが活用されることになりそうだ。
メタバースや生成AIの技術を、携帯電話販売の現場で活用しようという野心的なプロジェクトも展示していた。「AI接客」という展示では、複数のAIを組み合わせて、携帯販売を手助けするような技術を提案していた。
AI接客では、来店客の要望を聞いて、商品について案内を行う。従来型の対話型AIと異なるのは、LLMを用いて柔軟な応答ができることだ。
さらに、発話内容や声のトーンや表情から、来店者の感情を分析して、それに合わせて対応する機能も備えている。例えば、来店者から怒っていると分析した場合には、通常の会話よりも早口で話しつつ、「オペレーターに電話でおつなぎできます」といった案内するという。
LLMは、NTTが開発したTuzumiや、マイクロソフトのAzure OpenAI Serviceを利用しており、企業固有の情報を学習することもできる。
このAI接客は開発途上にある技術だ。ドコモはまず自社のオンラインショップで一部機能を導入し、効果を検証する。
将来的にはドコモショップでの活用も視野に入れている。NTTドコモの小林拓也氏は「来店してからカウンターにご案内するまでの待ち時間で、AI店員に困っていることを相談していただく形を考えている」と構想を示した。
Copyright © ITmedia, Inc. All Rights Reserved.