ITmedia NEWS > 速報 >
速報
» 2019年07月12日 10時29分 公開

Facebookとカーネギーメロン大学開発のAI「Pluribus」、ポーカーの6人ゲームでプロに勝利

Facebookとカーネギーメロン大学が共同開発したAI「Pluribus」が、5人のトッププロとの「テキサスホールデム」ゲームで勝利した。

[ITmedia]

 米Facebookと米カーネギーメロン大学は7月11日(現地時間)、共同開発したAI「Pluribus」(「もっと」という意味のラテン語)が、ポーカーの「テキサスホールデム」形式のゲームで、世界のトッププロ5人を打ち負かしたと発表した。トッププロ1人と5つのAIでのゲームでもAIが勝利した。

 poker 1 Pluribusが勝ったゲームの例

 カーネギーメロン大学は2017年、「Libratus」(「バランスのとれた」という意味のラテン語)というAIで4人のプロに勝利した。この時のゲームは1対1の「ヘッズアップ」ゲームだった。Pluribusはこれをさらに高度にすることで、5人を相手にするゲームに対応した。

 AIは既に囲碁や将棋では人間のプロに勝利しているが、ポーカーの場合はそれらのゲームと異なり、勝つための情報が隠されている。さらに相手が複数になれば、ゲームはより複雑になる。

 Pluribusはこの複雑さに対処するために、対戦相手の手を最後まで予測するのではなく、2つか3つ先の動きだけを予測するよう設計された。ポーカーでは「ブラフ」が成功すると、ゲームの流れが劇的に変わる可能性がある。Facebookの研究者、ノーム・ブラウン氏(カーネギーメロン大学出身で英Deep Mindでのインターン経験を持つ)は先までの予測を切り捨てるアプローチが「真の飛躍的進歩」をもたらしたと語った。

Pluribus Poker AI: Sample poker hands vs. professionals

Pluribus is the first AI capable of beating human experts in six-player no-limit Hold’em, the most widely played poker format in the world. This is the first time AI has beaten top human players in a complex game with more than two players or two teams. This video shows sample hands from Pluribus’s experiment against professional poker players. (Cards are turned face up to make it easier to see Pluribus’s strategy.)

Facebook AIさんの投稿 2019年7月10日水曜日

 このアプローチのおかげで、トレーニングプロセスも効率的になった。Pluribusは512GB以下のRAMを搭載した64コアサーバで8日で構築したという。Pluribusのトレーニングに掛かったコストはわずか150ドルだった。

 poker 2

 Facebookは、このイノベーションは今後、複数の要因と隠された情報が複雑に絡み合う現実世界での問題、例えばサイバーセキュリティや災害予測、オンラインオークション、交通渋滞問題などで応用していけるとしている。

 この研究の論文はScienceで公開されている。

Copyright © ITmedia, Inc. All Rights Reserved.