Google DeepMind、「Gemini Robotics」でAIを現実世界へ
米Google傘下のGoogle DeepMindは3月12日(現地時間)、ロボットが物理的な世界で、より効果的に行動できるよう設計されたAIモデル「Gemini Robotics」を発表した。Gemini 2.0を基盤とし、視覚、言語理解、物理的な動作を統合し、様々なタスクを実行できる。
まだ実験段階で一般には公開していないが、韓国Hyundai Motor Group傘下のBoston Dynamicsなどの企業がテスターとして開発に参加している。
Gemini Roboticsは、現実世界で行動する能力をロボットに与えることを目指す。学習していない未知の状況や物体、複雑な指示、新しい環境にも対応でき、ロボットにインタラクティブ性を持たせる。
DeepMindはまた、「複雑で動的な世界を理解する」ことができる高度な視覚言語モデル「Gemini Robotics-ER」も発表した。こちらもGemini 2.0ベースで、マルチモーダルな推論能力を物理世界に拡張し、特に空間的および時間的な理解を強化することを目的とする。
Gemini Roboticsについては、例えば、メガネケースを開けたり、ヘッドホンのコードを巻く、弁当箱におかずを詰める、折り紙で狐を折るといった動作のデモが紹介されている。
Gemini Robotics-ERでは、空間理解能力を示すデモとして、コーヒーカップを見せられた際に、取っ手をつかむための適切な二本指の把持と安全な接近軌道を直感的に理解できる例が紹介されている。
DeepMindは公式YouTubeチャンネルで、多数のデモ動画を公開した。
DeepMindは、これらの開発では、安全性が重要だとし、Google AIの倫理原則に沿って責任ある開発を進めているとしている。ロボットが物理世界で行動するという性質上、テキストや画像などのデジタル領域のAIモデルとは異なる、特別な安全性の考慮が必要だと強調した。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
5
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
6
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
7
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
8
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
9
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
10
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR