Waymo、DeepMindの「Genie 3」で自動運転をシミュレート 「もしも」の状況を無限に生成
Google系列の自動運転企業WaymoはGoogle DeepMindの汎用ワールドモデル「Genie 3」を基盤とした自動運転シミュレーター「Waymo World Model」を発表した。竜巻や積雪などの状況をリアルに再現し、実世界で遭遇する前に「Waymo Driver」の対応能力を高める狙いだ。
米Google系列の自動運転企業Waymoは2月6日(現地時間)、Google DeepMindの“汎用ワールドモデル”「Genie 3」採用の自動運転シミュレーションモデル「Waymo World Model」を発表した。カメラ映像だけでなく、LiDARなどのセンサーデータを含むマルチモーダルデータを生成できる。
Waymoの自動運転システム「Waymo Driver」は、既に主要な米国都市で約2億マイル(約3億2000万キロ)の完全自動運転による実走行実績を持ち、仮想空間では数十億マイルものシミュレーションを行っているが、今回発表されたモデルは、生成AIを活用してそのシミュレーション能力をさらに拡張するものだ。
従来の自動運転シミュレーションモデルの多くは、収集した路上データのみに基づいてゼロからトレーニングされていたため、システムが学習できる範囲は実際に経験したシナリオに限られていた。また、3Dガウシアンスプラッティング(3DGS)のような再構成技術を用いた手法は、実走行シーンの再現には優れているものの、そこから逸脱した新しい動きをシミュレーションしようとすると、観測データが不足し、視覚的な整合性が崩れてしまうという課題があった。
Google DeepMindが昨年8月に発表したGenie 3は、Web上の大量の動画データで事前学習された汎用的なワールドモデルで、物理法則や世界の多様な事象に対する広範な知識を有している。Waymoは、このGenie 3の2D動画に関する知識を、Waymo固有のセンサー構成に合わせた3DのLiDAR出力へと転移学習させた。これにより、実車データの収集だけではカバーしきれない状況でも、物理的な一貫性を保ちながらリアルな環境を生成することが可能になったとしている。
ただし、Genie 3には、フレームを逐次生成する過程で不正確さが蓄積し、1分以上経過すると一貫性を維持するのが難しくなるという技術的な課題が存在する。これに対しWaymoは、計算コストを削減しつつ高いリアリズムを維持できる効率的なバリアントを採用することで対処したという。この改良により、高速道路での合流や複雑な近隣エリアの通過といった、長時間にわたるシーケンスでも品質を安定させたまま推論を行うことが可能になったとしている。
具体的には、竜巻や洪水、山火事といった極端な気象条件や自然災害に加え、道路上に象が現れたり、ティラノサウルスの着ぐるみを着た歩行者がいたりといった、現実には起こりそうにない事象までシミュレーションできる。また、ドライブレコーダーや通常のカメラで撮影された動画を変換し、Waymo Driverがそのシーンをどう認識するかを再現することも可能で、多様な学習環境を構築できる。
特徴的な機能の1つに、「Driving action control」(運転行動制御)がある。これは、過去の走行データに対して「もしあの時、道を譲らずに進んでいたらどうなっていたか」といった、実際とは異なる行動(反実仮想)を入力として与えられる機能だ。従来の再構成手法とは異なり、Waymo World Modelは元のルートから逸脱した操作を行っても、新たな視点からの映像やセンサーデータをリアルタイムに生成し、視覚的・物理的な整合性を保ったままシミュレーションを完遂できるとしている。
Waymoは、このモデルを用いて実データだけでは不可能に近い状況や極めて稀なケースを積極的にシミュレートすることで、実世界で遭遇する前にWaymo Driverの対応能力を高める狙いだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Waymoのロボタクシー、学校付近で児童と接触──緊急ブレーキで負傷者はなし
Waymoの自動運転車がサンタモニカの学校付近で児童と接触する事故が発生した。児童に怪我はなかったが、連邦安全当局が調査を開始している。Waymoは、二重駐車のSUVの影から飛び出した児童を検知して急ブレーキをかけたと説明。シミュレーションの結果、人間のドライバーよりも大幅に減速できていたと主張している。
Google、“歩ける”世界を生成する「Project Genie」を米国で試験公開 「Genie 3」と「Nano Banana Pro」を統合
Googleは、テキストや画像から対話型の仮想世界を生成・探索できるプロトタイプ「Project Genie」を米国の特定ユーザー向けに公開した。汎用ワールドモデル「Genie 3」を基盤とし、ユーザーの操作に応じて環境がリアルタイムで描画され続けるのが特徴。探索できるのは最大60秒間。
Waymo、大規模停電下のロボタクシー“立ち往生”の原因と対策を説明
ロボタクシーサービスを提供するWaymoは、サンフランシスコの大規模停電に伴う車両の立ち往生についての分析結果を公表した。広範囲の信号停止により遠隔支援システムへのリクエストが集中し、システム負荷が処理能力を超えたことが原因と説明。今後は停電情報の統合や緊急対応プロトコルの更新を行い、インフラ異常時の堅牢性向上を図る。
Google DeepMind、リアルタイムで世界を生成するAI「Genie 3」発表 “AGIへの足がかり”
Google DeepMindは、プロンプトから対話可能な世界をリアルタイムで生成するAI「Genie 3」を発表した。物体の状態を記憶する「ワールドメモリ」機能を搭載し、数分間の一貫性を維持する。AGIへの足がかりと位置づけられ、AIエージェントの訓練などに活用される。

