米Google傘下のGoogle DeepMindは6月24日(現地時間)、ロボット上でローカルに実行できるよう最適化されたAIモデル「Gemini Robotics On-Device」を発表した。このモデルは、まずは「信頼できるテスタープログラム」にサインアップした選ばれた開発者グループに初期リリースされる。
同社は3月に、クラウドに接続して利用する「Gemini Robotics」を発表した。こちらはクラウド上のVLA(Vision-Language-Action)と、ロボット上で実行するローカルアクションデコーダーで構成されており、エンドツーエンドで約250msのレイテンシーがある。
一方、Gemini Robotics On-Deviceは、モデル全体がロボット上で完全にローカルに実行されるよう最適化されている。これにより、データネットワークに依存せずに動作し、レイテンシーが問題になるアプリや、ネットワーク接続が断続的またはゼロの環境でのロボット活用が可能になるとしている。
例えばカバンのジッパーを閉めたり、服をたたむといった複雑な操作もできる。
50〜100回のデモンストレーションで新しいタスクを学習できるため、ロボットに新しい動作を教えるプロセスが大幅に簡素化される。また、全く異なる形態のロボットにも効率的に適応できる。
プログラムに参加する開発者は、Gemini Robotics SDKにアクセスし、自身のタスクや環境でのモデル評価、MuJoCo物理シミュレータでのテスト、新しいドメインへの適応を行える。
Google DeepMindは、すべてのGemini RoboticsモデルをGoogle AI原則に沿って開発しており、包括的な安全アプローチを適用しているという。開発者には、新たに開発した意味的安全性ベンチマーク「ASIMOV」データセットを用いた評価や、モデルの脆弱性を特定するためのレッドチーミング演習を推奨している。同社の責任ある開発・イノベーション(ReDI)チームと責任・安全評議会(RSC)が、モデルの社会への影響を分析し、リスクを最小限に抑えつつ利益を最大化するための助言とレビューを行っている。
Google DeepMind、「Gemini Robotics」でAIを現実世界へ
Google、「Project Astra」を向こう数カ月中にGeminiアプリに導入へ
Google DeepMind、卓球ロボットを開発 アマチュアになら勝てるレベル
Google DeepMind、ロボットの行動を改善する新VLAモデル「RT-2」発表Copyright © ITmedia, Inc. All Rights Reserved.