囚人のジレンマ(しゅうじんのじれんま)情報システム用語事典

prisoner's dilemma

» 2009年01月06日 00時00分 公開
[@IT情報マネジメント編集部,@IT]

 ゲーム理論で最も有名なゲームの1つ。各プレーヤーが自己の利益だけを考えて選択した合理的戦略が、全体にとっては最良の選択とはいえない結果をもたらすことを示すモデルである。

 ゲーム理論の基本定理であるナッシュ均衡(ないしミニマックス定理)は、さまざまな行動主体が個別合理的に意思決定を行うと安定した戦略の組みがあることを示すが、それが社会合理的であるならばアダム・スミス(Adam Smith)の「神の見えざる手」と同様の結論だといえる。しかし、囚人のジレンマが示すのは、個別合理性が必ずしも社会合理性に結び付かないという例である。

 囚人のジレンマは、一般に次のようなエピソードで説明される。

 2人の容疑者が当局に捕まって、それぞれ別室で尋問を受けている。取調官は強盗共犯の嫌疑で彼らを拘束しているが十分な証拠がなく、2人が黙秘を通せば微罪による軽い刑罰しか求刑できない。もし、どちらかが司法取引に応じて共犯証言をすればその者は不起訴・釈放となり、黙秘を続けた方は重い実刑を受ける。また、両方がそろって自白すれば起訴は免れないが、情状酌量による減刑によって中程度の実刑で済むことが期待できる。

 このゲームの利得の一例をマトリクスで表現すると、以下のようになる。

  容疑者Bの戦略
黙秘 自白
容疑者Aの戦略 黙秘 (−1年, −1年) (−10年, 0年)
自白 (0年, −10年) (−5年, −5年)
囚人のジレンマの利得行列の例 セル内の数字は前者が容疑者Aの、後者が容疑者Bの服役年数。この値が大きいほどプレーヤーにとってマイナス利得であることを示すため、負の値とした

 上記の値を前提に容疑者Aの立場で考えると、“自白”ならば最悪でも5年の服役、うまくすれば即座に釈放なのに対し、“黙秘”は最善でも1年、最悪の場合は10年の服役となる。期待値を考えれば、容疑者Aの合理的選択は“自白”である。しかもこのモデルでは、2人の容疑者は隔離されていて相談ができないため、両プレーヤーは相手の出方を推測するしかない。相手の置かれている状況は自分と同じなので、「相手の合理的選択は“自白”だ」との推量が成り立つ。相手が“自白”だとすると、自分の最適選択はやはり“自白”となる。この“両者自白”はナッシュ均衡だが、その利得は両者が黙秘を守った場合よりも悪い。逆にいえば、全体で利得最大となる“両者黙秘”は、お互いの裏切り(自白への戦略変更)を誘引するので均衡状態ではない。

 囚人のジレンマは1950年にランド・コーポレーションのメリル・M・フラッド(Merrill Meeks Flood)とメルビン・ドレシャー(Melvin Dresher)が数理モデルとして考案したもの。同年、同じランドで顧問をしていたアルバート・W・タッカー(Albert William Tucker)がスタンフォード大学の心理学者たちにゲーム理論をテーマにした講演を行うことになり、このときにフラッド/ドレシャーのモデルに「囚人のジレンマ」という名前を付けて、ストーリー仕立てで紹介した。

 典型的な囚人のジレンマから得られる教訓は「信頼関係の確立」だが、利得の大小によって悩みの内容が変わってくる。その後もプレーヤー心理を加味したモデルなど、さまざまなバリエーションで研究が行われた。

 中でも有名なのが、「1回限りの2人ゲーム」だった囚人のジレンマを反復型に拡張して行われたロバート・アクセルロッド(Robert Axelrod)の研究である。ミシガン大学の政治学者であるアクセルロッドは1980年に「繰り返し型の囚人のジレンマ」で囚人プレーヤーとなるコンピュータプログラムを募り、総当たりで勝負させるという実験を行った。14のプログラムが参加した第1回大会で勝利したのは、アナトール・ラパポート(Anatol Rapoport)が考案した“しっぺ返し”戦略を採用していた。これは最初のラウンドでは自身は裏切らず、第2ラウンド以降は相手が前回裏切っていた場合に限って裏切り返すという簡単なアルゴリズムだった。続く第2回・第3回大会でもこのプログラムは優秀な成績を残したという。だだし、1対1ではしっぺ返し戦略に勝つ戦略は珍しくなく、多数の戦略が混在する特定の条件下における結果である点には留意が必要である。

参考文献

▼『囚人のジレンマ――フォン・ノイマンとゲームの理論』 ウィリアム・パウンドストーン=著/松浦俊輔=訳/青土社/1995年3月(『Prisoner's Dilemma』の邦訳)

▼『もっとも美しい数学――ゲーム理論』 トム・ジーグフリード=著/冨永星=訳/文藝春秋/2008年2月(『A Beautiful Math: John Nash, Game Theory, and the Modern Quest for a Code of Nature』の邦訳)

▼『社会的ジレンマ――「環境破壊」から「いじめ」まで』 山岸俊男=著/PHP研究所・PHP新書/2000年7月

▼『ゲーム理論』 岡田章=著/有斐閣/1997年1月

▼『つきあい方の科学――バクテリアから国際関係まで〈新装版〉』 ロバート・M・アクセルロッド=著/松田裕之=訳/ミネルヴァ書房/1998年5月(『The Evolution of Cooperation』の邦訳)


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ