TechShareによると、G1の下半身制御には深層強化学習を活用しているという。シミュレーション環境で数千体の仮想ロボットを動かし、成功と失敗を繰り返させることで、より最適な歩行バランスを学習させる方式だ。
もともと二足歩行をルールベースでプログラムしようとすると、足首や膝、腰など多自由度の関節が相互に影響し合い、設計が極めて煩雑になりやすい。そこで、物理モデルの細部にこだわる代わりに、仮想空間内で試行錯誤を高速に回し、実機への適用段階で微調整を施すアプローチを取っているそうだ。
一方、上半身の動きには模倣学習の概念が取り入れられている。手先で物を握ったり、人と握手する動作は、対象物や相手の動き方が千差万別であるため、ルールベースやシミュレーションだけでは対応しづらい面がある。
そこで人間の操作データ――例えば遠隔操作やモーションキャプチャーから得られる指の曲げ角度、力加減、カメラ映像などをAIに学習させ、ロボットが自然な作業動作を身に付ける狙いがある。
TechShareのブースでは、指先に磁気センサーを仕込んだグローブを用いて手指の動きを取得する例が紹介されていた。
Copyright © ITmedia, Inc. All Rights Reserved.