メディア

MicrosoftのAIが「ミズ・パックマン」で全面クリア

Microsoftのディープラーニングチームが開発したAIが、「パックマン」より複雑な「ミズ・パックマン」の最高スコア、201面での999,999点を打ち出した。

» 2017年06月15日 08時03分公開

　米Microsoftの研究部門であるMicrosoft Researchは6月14日（現地時間）、「強化学習」採用の人工知能（AI）で、家庭用ゲーム機「Atari 2600」版の1980年代のゲーム「Ms. Pac-Man」（ミズ・パックマン）で99万9990という最高スコアを打ち出したと発表した。

最高スコアの瞬間

　201面でのこのスコアが最高点であることは、達成後スコアが0に戻ったことで判断した。

　ミズ・パックマンは、1981年に人気ゲーム「パックマン」のクローンとして開発され、後にナムコに公認されたアーケードゲーム。ゴーストの動きがランダムだったり、フルーツも迷路内を移動するなど、オリジナルパックマンより難しい。

　コンプリートに成功したのは、Microsoftが1月に買収したカナダのディープラーニング企業Maluubaのチーム。

　同社が「Hybrid Reward Architecture」と呼ぶアーキテクチャを採用するこのAIは、150以上の単目的のエージェントとそれらのエージェントの情報に基いて総合的な判断をするトップエージェントで構成される。部下のエージェントはそれぞれパラレルに働き、自分にとって最善の決定をトップエージェントに報告し、トップエージェントはそれを総合して判断する。

　例えば、多くの部下が「フルーツが右方向にあるから右に行きたい」と主張しても、2つの部下が「右に行くとゴーストがいるから左に行くべきだ」と主張すれば、トップは左に行く方を選ぶ。

　Hybrid Reward Architectureは、米Alphabet傘下のDeepMindの「DQN」と同様に「強化学習」を使っている。強化学習は、「教師あり学習」と異なり正解を与えずにAIが出す答えを評価していくことで学習させるので、正解のない事象で最善策を決めるのに役立つ。

　Microsoftは、強化学習採用AIエージェントは、高度で複雑な知的労働での意思決定支援に活用できるとしている。

変更履歴：当初、DQNでは強化学習を採用していないという記述にしていましたが、https://deepmind.com/research/dqn/を確認し、訂正しました。［2017/6/15 16:00］

Microsoft、AI部門を新設　研究部門統合で5000人規模に
新部門として「Microsoft AI and Research Group」を設立。人工知能に注力した製品開発を加速する。
DeepMind、3DゲームのようなAI開発プラットフォーム「DeepMind Lab」をオープンソース化
Alphabet傘下のDeepMindが、ファーストパーソン3Dゲームのような人工知能（AI）研究開発プラットフォーム「DeepMine Lab」をオープンソースで公開すると発表した。OpenAIの「Universe」は2Dだが、こちらは3D環境だ。
Googleの人工知能「DQN」、アタリゲームで人間よりハイスコア叩き出す
Google傘下の人工知能企業DeepMindが、ブロック崩しなどのビデオゲームのルールをほぼゼロから学習し、人間よりハイスコアを獲得するまでに成長する人工知能アルゴリズム「DQN」に関する論文をNatureで発表した。
「Build 2017」初日基調講演まとめ
Microsoftの開発者会議「Build 2017」の初日基調講演は「Visual Studio for Mac」など開発者向け発表が中心だったが、「Invoke」やPowerPointの同時通訳機能など、一般ユーザーにとっても興味深いデモも行われた。