Google DeepMind、インタラクティブな3D世界を作るAI「Genie 2」発表

» 2024年12月05日 09時01分公開

[ITmedia]

　米Google傘下のGoogle DeepMindは12月4日（現地時間）、テキストや画像から多様な3D仮想世界を生成するfoundation world model（基盤世界モデル）の「Genie 2」を発表した。

　Genie 2では1人称視点、アイソメトリックビュー（斜め上から見下ろす視点）、3人称視点など、多様な視点からの世界を生成でき、生成した仮想世界は、キーボードとマウスを使って操作できる。また、物理法則やNPCの行動などをリアルにシミュレートできる。ただし、生成できるのは最大1分間だ。

　Genie 2の応用例として、現実世界では危険なタスクを含む、多様な状況でのAIエージェントのトレーニングや評価、ゲーム開発者やアーティストが新たな体験をプロトタイピングすることの支援などが考えられる。

　Genie 2は大規模な動画データセットでトレーニングされた自己回帰型拡散モデルという。Google DeepMindはこのデータセットのソースについては言及していない。

　Genie 2で生成された動画の複数のサンプルを公式ブログで見ることができる。

　公式ブログにはGenie 2を公開しているのかどうかについては明記されていない。

　インタラクティブな仮想世界を生成するAIモデルとしては、米World Labsが2日、1枚の画像からインタラクティブな3D世界を生成する技術を発表した。

Google DeepMind、高精度天気予測AI「GenCast」をオープンソース化
Google DeepMindは、生成AIベースの高精度天気予測モデル「GenCast」を発表した。最大15日先までの日々の天気と台風などの気象現象の両方を正確に予測できるとしている。
Google Cloudで動画生成AI「Veo」のプライベートプレビュー開始
Googleは、Google CloudのVertex AIで動画生成AI「Veo」のプライベートプレビューの提供を開始した。また、画像生成AI「Imagen 3」をすべてのVertex AIユーザーへの提供を開始する。
フェイフェイ・リー博士のWorld Labs、写真から“探索できる”3D生成のAI
AI研究で知られるフェイフェイ・リー博士率いる新興“空間インテリジェンス企業”World Labsは、1枚の画像からインタラクティブな3D世界を生成する技術を発表した。公式ブログで多様なエフェクトを体験できる。
AIをゲーム作りにどう使う？　CygamesがCEDECの講演動画を無償公開
Cygamesが、ゲーム開発者向けイベント「CEDEC」で過去に実施したセッションの動画を公開した。ゲーム開発におけるAIの活用に注目したものなど、全3本を視聴できる。