初めまして、プロポーカープレイヤーの木原直哉と申します。「人工知能(AI)がポーカーのトッププロ4人に勝った」というニュースが世間をにぎわせています。しかし、これらのニュースを読む中で、自分の認識と違うなと思うことがいくつかありました。
「なぜ、AIは人間に勝てたのか」を始め、このニュースについて自身が感じたことなどを、ポーカープロの立場から解説していきたいと思います。
(編集:ITmedia村上)
1981年生まれの北海道出身で、2001年に東京大学理科一類に入学。在学中は将棋部に所属し、バックギャモンやポーカーなどの頭脳ゲームに熱中していく。10年かけて東京大学理学部地球惑星物理学科を卒業し、翌2012年の第42回世界ポーカー選手権大会 (2012 World Series of Poker) の「ポット・リミット・オマハ・シックス・ハンデッド」で日本人初の世界タイトルを獲得。賞金51万2029ドル(約5022万円)を手にした。職業はプロ・ポーカープレイヤー。
著書に『運と実力の間(あわい)―不完全情報ゲーム(人生・ビジネス・投資)の制し方』(飛鳥新社)、『たった一度の人生は好きなことだけやればいい! 東大卒ポーカー世界チャンプ 成功の教え』(日本能率協会マネジメントセンター)、『東大卒ポーカー王者が教える勝つための確率思考』(中経出版)がある。
まず、「ポーカーでAIがプロに勝った」という表現に違和感を持ちました。ポーカーと一言で言いますが、ポーカーには何十種類ものゲームがあります。
なので、我々ポーカープレイヤーからすると「金メダリストに勝った」くらい乱暴な表現で、100m走なのか、マラソンなのか、砲丸投げなのか、はたまたバレーボールなのか、何の競技で勝ったのか全く不明です。
とはいえ、100m走のようなメジャーなスポーツを思い浮かべる人が多いように、ポーカーだと、2枚の手札と共通する5枚のカードを使ってチップを賭ける「テキサスホールデム」というゲームが最も広く知られています。
その中でも、賭ける金額に縛りがない「ノーリミットテキサスホールデム」が一番代表的なゲームです。今回のニュースは、その種目で「1対1の勝負」(トッププロは計4人)が行われ、トータルでAIが大きく勝ちこしたというものです。
すでに多くのメディアでこのニュースが報道されていますが、他にも違和感を抱いたところがあるので、その点について説明したいと思います。
まずは、今回実施されたゲームの形式についてです。通常、ポーカーは6人〜10人で行われることが多く、それより少ない人数でのプレイは、トーナメントの終盤で残り人数が少なくなるまでほとんど行われることはありません。
しかし、AIと人間の勝負はその性質上、普段はほとんど行われることのない「1対1」(※ポーカー用語でヘッズアップと呼びます)でやらざるを得ません。ヘッズアップのポーカーは、通常の6人以上のゲームとは全く感覚が異なります。
6人のゲームでは、平均して6回に1回勝負に勝ち、その上で、勝つときは対戦相手よりやや多くチップを得て、負けるときに失うチップをやや小さくすることができれば、トータルで勝つことができます。
一方、ヘッズアップでは、平均して2回に1回勝負に勝たないといけないのです。なので、プロのプレイヤーといえども、ヘッズアップが強いかどうかはまた別物なのです。
こうした事情もあり、今回はヘッズアップの専門家である4人が集められました。うち3人は自分も知らないプレイヤーですが、Dong Kimはヘッズアップの世界でトップ3に入ると言われているプレイヤーです。
2点目は、AIが人間側に「日本円で2億円超えのチップ額で圧勝」となっていることです。先に言うと、この2億円という数字自体に全く意味はありません。
まず、この勝負では実際にはお金は一切賭けられていません。
1点=100ドルと表記し、その数字を競ったわけですが、仮に1点=1ドルと表記しても勝負としては全く一緒なわけで、その場合は「200万円の勝ち」となっていたはずです。
意味がある数字としては、プロ4人が3万ゲーム(ポーカーでは3万ハンドと数えます)ずつ、合計12万ハンドをこなした上で、1ハンドは最大200点動くというルールで、プロがトータルで17600点負けたということなのです。
「100ハンド当たり、何点勝って何点負けたか」というのが、実力を測る上で大きな指標になります。今回の結果は、人間から見て100ハンド当たり14.6点の負け。そしてその数字は、「今回のルールにおいて、プロ的には大差、はっきり実力差があって負けた」とみなされるべき数字なのです。
ポーカーは運の要素が大きく出ます。そのため、結果の分析には統計的な処理が必要になってくるのですが、今回の勝負においては、運の要素を最大限小さくするため、通常のポーカーでは存在しえない「デュプリケート(重複)方式」を採用しています。
あるカードの組み合わせは片方が勝ち、片方が負けるわけですから、運の要素が大きいです。しかし、公平を期すために逆の組み合わせも併せて勝負しようとしても、次に来るカードを覚えてしまうため不可能です。
ところが、ある組み合わせをAI対人間Aで戦い、その逆の組み合わせを人間B対AIで勝負すれば、人間側は個人としては運の要素は大きく出ますが、チームのトータルとして運の要素を最大限抑えることができます。
実は、この勝負と全く同様の勝負が2015年にも行われました。そのとき、筆者は「ほぼ互角か、人間側がわずかに負け越すのではないか」と思っていました。しかし、ふたを開けてみれば、人間が8万ハンドで7000点の勝ち越し。人間から見て100ハンド当たり9点の完勝と言ってよいでしょう。
ところが、終了後の会見で、AIを開発したカーネギーメロン大学教授は、「100ハンド当たり9点は統計的に運の範囲内であり、実力的にはポーカーのトッププロに追いついた」と発言し、ポーカー界から大批判を受けたのです。
今年の勝負は、筆者は人間がかなり負け越すと見てました。しかし、100ハンド当たり9点以内に負けが収まれば、AI開発側に盛大なブーメランが突き刺さるのではと思って、それを期待していたのですが……(笑)。結果は先ほど言ったように、人間側が100ハンド当たり14.6点の負けです。
ポーカー界では、この勝負をもってAIが人間にポーカー勝負で勝ち越したとは言えないのではないかという意見が主流ですし、その点においては筆者も同意です。
しかし、囲碁の世界ではトッププロに4子の格下と言われていたのが、たった2年で3子の格上になってしまったのです。複雑で深いゲームの方が、当然ですが人間にとってもコンピューターにとっても難しいです。
そのため、コンピューターが進化する前は、複雑なゲームは人間の独壇場かと思われてましたが、実際は複雑で深いゲームこそ、人間がコンピューターに勝つのが難しいのです。
ポーカーは、相手の手が見えない不完全情報ゲームであり、ゲームとしては非常に深く難しいものです。そのため、囲碁のトッププロに勝ち越したGoogleのAI開発チームがポーカーに本気を出せば、半年もかからずに人間はコンピューターに勝てなくなると思います。
AIが人間に勝ったのは、癖を読んだとか、勝つ要因があったとかなかったとかではなく、単純に人間側の実力不足なのです。
ここで、今回のゲームにおいて注目したい、「人間なら普通はやらない、AIの変わったプレイ」を紹介します。少し専門的な内容になりますが、簡単に言うと、「適正とされる金額とはかけ離れた、大きな金額のベット」をしてきたのです。
Copyright © ITmedia, Inc. All Rights Reserved.