米NVIDIAは10月20日(現地時間)、ロボットに高速な“ペン回し”や引き出しの開閉など、複雑なスキルを自律的に教えるAIエージェント「Eureka」(ユリイカあるいはエウレカ)を発表した。
NVIDIAは、米OpenAIのGPT-4搭載のEurekaのライブラリを公開し、強化学習研究用の物理シミュレーションリファレンスアプリケーション「Nvidia Isaac Gym」で実験できるようにしている。Isaac Gymは、3Dツールとアプリを構築するための開発プラットフォームNvidia Omniverseで利用できる。
Eurekaによるロボット教育の大まかな流れは、まずGPT-4と生成AIを使って、強化学習のためにロボットに報酬を与えるコードを作成する。Isaac GymのGPU高速化シミュレーションを使って報酬候補の大規模なバッチの品質を評価し、より効率的なトレーニングを実現する。そのトレーニング結果から主要な統計の概要を構築し、報酬関数の生成を改善するようGPT-4に指示する。
これにより、ロボットがロボットアームであれ、二足歩行ロボットであれ、動作を自己改善していく。
NVIDIAは論文で、「Eurekaは、タスク固有のプロンプトや事前定義された報酬テンプレートを使わずに、人間の専門家による報酬を上回る報酬関数を生成する。10種類の異なるロボットを含む29の環境で、Eurekaはタスクの83%で人間の専門家を上回り、平均52%の正規化改善につながった」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR