今回Laboro.AIでは、ビルの揺れをシミュレートする環境を作り、どのように重りを動かしたら揺れを早期に打ち消せるかを、深層強化学習を使って学ばせた。
「囲碁では、AlphaGoに初めはランダムに打たせて、たまたま勝ちにつながる良い手を打ったときは、そういう行動を強調するような信号を与え、負けたときは抑制するような信号を与え、経験を積んで最適な行動を学んでいく。同じように、ビルの揺れをシミュレートする環境を作って、初めはランダムに重りを動かす。より揺れを抑えられたらプラスの報酬シグナルを与えて、揺れが大きくなってしまったらマイナスの報酬を与えて学習させる」(椎橋氏)
この学習を約2万回、シミュレーション環境で行ったところ、学習曲線が最適化され、1秒ほどで揺れを抑える動きを習得した。
この学習結果を使い、実際の橋を使った環境で重りの動きを制御させたところ。従来の数式に基づいたアルゴリズムで重りを制御するよりも、揺れを抑えることに成功した。
すべてのAI活用に共通する原則とは何か? トロント大学AI権威アジェイ・アグラワル教授
資産運用で挫折しそうなときに“激励” AIが読み取るユーザーの心理とは?
JR赤羽駅のAI無人店舗を体験してみた
表情を読み取る「AIお姉さん」が画面から話しかけてくる
人間対AI「囲碁電王戦」再び 趙名誉名人と「DeepZenGo」が真剣勝負Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング