検索
速報

Meta、戦略ゲーム「ディプロマシー」をプレイできるAI「キケロ」を公開

MetaのAI部門が、戦略ボードゲーム「ディプロマシー」をプレイできるAI「CICERO」(キケロ)を発表した。人間との駆け引きが必要なこのゲームのオンライン版で人間の平均スコアの2倍以上を達成したとしている。

Share
Tweet
LINE
Hatena

 米Metaは11月22日(現地時間)、戦略ゲーム「ディプロマシー」で「人間レベルのパフォーマンスを達成したAI」、「CICERO」(ローマの政治家キケロにちなむとみられる)を発表した。オンライン版ゲームで人間と対戦し、人間のプレイヤーの平均スコアの2倍以上を達成し、上位10%にランキングされたとしている。

 diplomacy
オンライン版ディプロマシー

 ディプロマシー(外交)は、プレイヤー同士で協力したり騙し合ったりして欧州全土の補給地を奪い合うゲーム。文字通り外交センスが問われる。他のプレイヤーの動きの動機や視点を理解し、複雑な計画を立て、相手の動きによって戦略を調整する必要があるため、AIにはほぼ不可能なゲームとみられてきたとMetaは説明する。

 また、他のプレイヤーとの交渉には自然言語での会話が必要だ。

 「AIがこれまで征服してきたチェスや囲碁とは異なり、ディプロマシーは駒ではなく人間が相手のゲームだ」(Meta)

 ヒューマンモデリングで教師あり学習だけに依存すると、ディプロマシーのような駆け引きが重要なゲームでは騙されやすくなってしまう。CICEROはこれを修正するために、対話の一貫性と合理性のバランスを取る反復計画アルゴリズムを実行する。Metaが開発した「piKL」という計画アルゴリズムは、他のプレイヤーのポリシーを予測し、より高い期待値を持つ新たなポリシーを選択することで、予測を繰り返し改善していくというものだ。

 pikl
「piKL」の仕組み

 Metaは、ディプロマシーを人間とAIの相互作用を促進するための安全なサンドボックスとして使っているという。CICEROはディプロマシーをプレイすることしかできないが、その背後にある技術は将来多様な人間との相互作用に応用できるとしている。例えばAIアシスタントと単なる質問と答え以上の会話ができるようになるかもしれない。

 MetaはCICEROのコードとモデルをオープンソース化した。「われわれは人間とAIのコラボレーションにおける将来の進歩の可能性と、このモデルを使って人々がこの研究をどのように構築するかを見ることに興奮している」。

 関連論文やコードはCICEROのWebサイトで参照できる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る