ITmedia NEWS > 製品動向 >

NVIDIA、ロボットに“高速ペン回し”も教えるGPT-4搭載AI「Eureka」

» 2023年10月21日 07時05分 公開
[ITmedia]

 米NVIDIAは10月20日(現地時間)、ロボットに高速な“ペン回し”や引き出しの開閉など、複雑なスキルを自律的に教えるAIエージェント「Eureka」(ユリイカあるいはエウレカ)を発表した。


 NVIDIAは、米OpenAIのGPT-4搭載のEurekaのライブラリを公開し、強化学習研究用の物理シミュレーションリファレンスアプリケーション「Nvidia Isaac Gym」で実験できるようにしている。Isaac Gymは、3Dツールとアプリを構築するための開発プラットフォームNvidia Omniverseで利用できる。

 Eurekaによるロボット教育の大まかな流れは、まずGPT-4と生成AIを使って、強化学習のためにロボットに報酬を与えるコードを作成する。Isaac GymのGPU高速化シミュレーションを使って報酬候補の大規模なバッチの品質を評価し、より効率的なトレーニングを実現する。そのトレーニング結果から主要な統計の概要を構築し、報酬関数の生成を改善するようGPT-4に指示する。

 これにより、ロボットがロボットアームであれ、二足歩行ロボットであれ、動作を自己改善していく。

 arm 引き出しを開けるロボットアーム

 NVIDIAは論文で、「Eurekaは、タスク固有のプロンプトや事前定義された報酬テンプレートを使わずに、人間の専門家による報酬を上回る報酬関数を生成する。10種類の異なるロボットを含む29の環境で、Eurekaはタスクの83%で人間の専門家を上回り、平均52%の正規化改善につながった」としている。

 eureka Eurekaの報酬アルゴリズムで多様なタスクを実行できるようになったロボットたち(動画はこちら

Copyright © ITmedia, Inc. All Rights Reserved.