Innovative Tech(AI+)
ゲーム「DOOM」のプレイ画面をリアルタイムに生成するAI プレイも可能 米Googleが開発
Innovative Tech(AI+):
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
米Googleやイスラエルのテルアビブ大学に所属する研究者らが発表した論文「Diffusion Models Are Real-Time Game Engines」は、ニューラルネットワークのみで動作するゲームエンジン「GameNGen」を提案した研究報告である。3Dゲーム環境をリアルタイムで高品質に長時間シミュレートし、プレイヤーとのインタラクティブなやりとりを可能にする。
GameNGenの能力を示すため、研究チームは1993年に発売された一人称シューティングゲーム「DOOM」を用いてテストを行った。その結果、1台のTPU(Tensor Processing Unit)を使用して「Stable Diffusion v1.4」の拡張版を基に、リアルタイムにゲームをシミュレートすることに成功した。
具体的には、プレイヤーの入力(移動、視点の変更、アクションなど)に応じて、毎秒20フレーム以上の速度で新しい画面を生成する。また、プレイヤーの体力や弾薬の管理、敵キャラクターとの戦闘、環境オブジェクトの破壊、ドアの開閉などの複雑なゲーム状態の更新を実行し、ニューラルネットワーク内で再現する。
画質の面でも、GameNGenは成果を上げている。次のフレームを予測する際のPSNR(ピーク信号対雑音比)は29.4を記録。これは一般的なJPEG画像の中程度の圧縮レベルと同等を意味する。
完全にクリアではないものの、ゲームをプレイするのに十分な鮮明さを持っている。実際、人間の目で見ても、本物のゲーム画面とGameNGenが作り出した画面の区別がつきにくいほどの品質を達成している。
GameNGenの開発プロセスは2段階で構成。第1段階では、強化学習を用いてAIエージェントにゲームのプレイ方法を学習させる。このプロセスで得られた全てのゲームプレイデータが記録され、次の段階で活用される。第2段階では、拡散モデルを使い、過去のフレームとプレイヤーの操作を入力として、次のフレームを生成するよう学習を行う。この手法により、長時間のゲームプレイにわたって安定したフレーム生成が可能となっている。
Source and Image Credits: Dani Valevski, Yaniv Leviathan, Moab Arar, Shlomi Fruchter. Diffusion Models Are Real-Time Game Engines
Copyright © ITmedia, Inc. All Rights Reserved.
Innovative Tech(AI+)
2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
3
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
4
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
5
「もはや宗教」のClaudeに焦るOpenAI 流出メモが暴いた覇権交代のリアル
-
6
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
-
7
「日本がいないと成り立たない」世界へ、フィジカルAIが導く独自の交渉力
-
8
「今、Codexのレート制限を解除したい」を解決? “付与したリセット権の貯蓄”可能に 有料ユーザー向け
-
9
公式がワンコーラス公開→AIで無断フルコーラス化、拡散 大原ゆい子氏「無職転生III」OPが被害
-
10
Google Chromeの新機能「Skills」 AIプロンプトの“毎回手打ち”を不要に
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR