Google DeepMind、ロボットを完全ローカルで動かせるAIモデル「Gemini Robotics On-Device」を初期リリース
Google DeepMindは、ロボット上で完全にローカル実行できるAIモデル「Gemini Robotics On-Device」を初期リリースした。ネットワーク接続に依存せず低遅延で動作するため、オフライン環境でのロボット活用が期待される。
米Google傘下のGoogle DeepMindは6月24日(現地時間)、ロボット上でローカルに実行できるよう最適化されたAIモデル「Gemini Robotics On-Device」を発表した。このモデルは、まずは「信頼できるテスタープログラム」にサインアップした選ばれた開発者グループに初期リリースされる。
同社は3月に、クラウドに接続して利用する「Gemini Robotics」を発表した。こちらはクラウド上のVLA(Vision-Language-Action)と、ロボット上で実行するローカルアクションデコーダーで構成されており、エンドツーエンドで約250msのレイテンシーがある。
一方、Gemini Robotics On-Deviceは、モデル全体がロボット上で完全にローカルに実行されるよう最適化されている。これにより、データネットワークに依存せずに動作し、レイテンシーが問題になるアプリや、ネットワーク接続が断続的またはゼロの環境でのロボット活用が可能になるとしている。
例えばカバンのジッパーを閉めたり、服をたたむといった複雑な操作もできる。
50〜100回のデモンストレーションで新しいタスクを学習できるため、ロボットに新しい動作を教えるプロセスが大幅に簡素化される。また、全く異なる形態のロボットにも効率的に適応できる。
プログラムに参加する開発者は、Gemini Robotics SDKにアクセスし、自身のタスクや環境でのモデル評価、MuJoCo物理シミュレータでのテスト、新しいドメインへの適応を行える。
Google DeepMindは、すべてのGemini RoboticsモデルをGoogle AI原則に沿って開発しており、包括的な安全アプローチを適用しているという。開発者には、新たに開発した意味的安全性ベンチマーク「ASIMOV」データセットを用いた評価や、モデルの脆弱性を特定するためのレッドチーミング演習を推奨している。同社の責任ある開発・イノベーション(ReDI)チームと責任・安全評議会(RSC)が、モデルの社会への影響を分析し、リスクを最小限に抑えつつ利益を最大化するための助言とレビューを行っている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google DeepMind、「Gemini Robotics」でAIを現実世界へ
Google DeepMindは、物理的な世界のロボットの行動を制御するよう設計されたAIモデル「Gemini Robotics」を発表した。「Gemini 2.0」を基盤とする。学習していない未知の状況や物体、複雑な指示、新しい環境にも対応できるロボットを目指す。
Google、「Project Astra」を向こう数カ月中にGeminiアプリに導入へ
Googleは、現実世界でマルチモーダル理解を活用するエージェント「Project Astra」を、向こう数カ月でAndroidおよび「Samsung Galaxy S25」のGeminiアプリに導入する予定だと発表した。
Google DeepMind、卓球ロボットを開発 アマチュアになら勝てるレベル
Google DeepMindは、競技卓球でアマチュアレベルの能力を発揮するロボットを開発したと発表した。初級〜上級の人間29人と対戦し、13勝した。
Google DeepMind、ロボットの行動を改善する新VLAモデル「RT-2」発表
Google DeepMindは、ロボットのアクションを直接出力できるVLAモデル「RT-2」を発表した。Web上のテキストと画像でトレーニングされており、ロボットは直接学習していない物体や概念についての命令を実行できるようになる。

