検索
速報

Facebookとカーネギーメロン大学開発のAI「Pluribus」、ポーカーの6人ゲームでプロに勝利

Facebookとカーネギーメロン大学が共同開発したAI「Pluribus」が、5人のトッププロとの「テキサスホールデム」ゲームで勝利した。

Share
Tweet
LINE
Hatena

 米Facebookと米カーネギーメロン大学は7月11日(現地時間)、共同開発したAI「Pluribus」(「もっと」という意味のラテン語)が、ポーカーの「テキサスホールデム」形式のゲームで、世界のトッププロ5人を打ち負かしたと発表した。トッププロ1人と5つのAIでのゲームでもAIが勝利した。

 poker 1
Pluribusが勝ったゲームの例

 カーネギーメロン大学は2017年、「Libratus」(「バランスのとれた」という意味のラテン語)というAIで4人のプロに勝利した。この時のゲームは1対1の「ヘッズアップ」ゲームだった。Pluribusはこれをさらに高度にすることで、5人を相手にするゲームに対応した。

 AIは既に囲碁や将棋では人間のプロに勝利しているが、ポーカーの場合はそれらのゲームと異なり、勝つための情報が隠されている。さらに相手が複数になれば、ゲームはより複雑になる。

 Pluribusはこの複雑さに対処するために、対戦相手の手を最後まで予測するのではなく、2つか3つ先の動きだけを予測するよう設計された。ポーカーでは「ブラフ」が成功すると、ゲームの流れが劇的に変わる可能性がある。Facebookの研究者、ノーム・ブラウン氏(カーネギーメロン大学出身で英Deep Mindでのインターン経験を持つ)は先までの予測を切り捨てるアプローチが「真の飛躍的進歩」をもたらしたと語った。

*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***

 このアプローチのおかげで、トレーニングプロセスも効率的になった。Pluribusは512GB以下のRAMを搭載した64コアサーバで8日で構築したという。Pluribusのトレーニングに掛かったコストはわずか150ドルだった。

 poker 2

 Facebookは、このイノベーションは今後、複数の要因と隠された情報が複雑に絡み合う現実世界での問題、例えばサイバーセキュリティや災害予測、オンラインオークション、交通渋滞問題などで応用していけるとしている。

 この研究の論文はScienceで公開されている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る