GoogleのゲームAI、“探索なし”でチェスのグランドマスターレベルを達成　大量データでの訓練のみで：Innovative Tech

» 2024年02月15日 08時00分公開

[山下裕毅，ITmedia]

印刷

通知

連載「Innovative Tech」の新着をメールで通知

Innovative Tech：

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

Twitter: ＠shiropen2

　Google DeepMindに所属する研究者らが発表した論文「Grandmaster-Level Chess Without Search」は、これまでの定石である探索アルゴリズムを使用せずに、AIがチェスにおいて人間のグランドマスターに匹敵するレベルに到達できることを示した研究である。

論文のトップページ

　1997年にIBMのチェス専用のスーパーコンピュータ「Deep Blue」が世界チェスチャンピオンのガルリ・カスパロフさんを破った。この勝利は、複雑な思考と戦略を要するチェスで、機械が初めて人間を上回る可能性があることを世界に示した。

　Deep Blueは、豊富なチェスの知識と高度な探索アルゴリズムを組み合わせたシステムであり、現在「Stockfish 16」のような強力なチェスエンジンがこの路線を引き継いでいる。米DeepMindが開発する「AlphaZero」のようなシステムは、豊富なチェスの知識に頼らず自己学習することで高い性能を発揮している。

　近年のAIシステムのスケーリングによる劇的な進歩は、特に大規模なアーキテクチャとデータセットを用いた教師ありトレーニングによって推進している。しかし、チェスのように複雑な戦略が求められる領域で、これらの技術がどのように機能するかはいまだ明確ではなかった。この研究では、大規模なデータセットで人間によるチェスの知識や探索アルゴリズムを使わずに強力なチェスプレイを実現できるかどうかを探求した。

　研究チームは、270M（2億7000万）パラメータを持つトランスフォーマーモデルを使用し、1000万局のチェスゲームからなるデータセットでモデルを訓練した。このデータセットは、Stockfish 16が提供したアクション値で注釈付けしており、約150億のデータポイントが含まれている。この大規模なトレーニングにより、モデルは高度なチェスゲームを解決する能力を示した。

チェスのデータセット作成とその分析に関するプロセス

　モデルの性能を評価するため、オンラインチェスプラットフォーム「Lichess」での早指し対戦で人間のプレイヤーと対決し「Elo2895」を達成した。これは、グランドマスターレベルに相当し、ドメイン固有の調整や探索アルゴリズムを一切使用せずに成し遂げられたことであり、AlphaZeroやAIモデル「GPT-3.5-turbo-instruct」といった既存の先進的なモデルを超える結果となった。

提案するAIシステムのプレイスタイル例

Stockfish 16、AlphaZero（探索あり・なし）、GPT-3.5-turbo-instructに対する提案モデル（3つの異なるサイズ）の予測とプレイの強さの比較

　この研究で特に注目すべきは、強力なチェスパフォーマンスが大規模なトレーニングによってのみ実現可能であることが示された点である。モデルとデータセットのサイズを体系的に調査することで、より大きなモデルが、より大規模なデータセットでトレーニングされた場合に顕著な改善が見られ、この「スケールの法則」が、チェスという特定の領域でも有効であることを示した。

Source and Image Credits: Anian Ruoss, Gregoire Deletang, Sourabh Medapati, Jordi Grau-Moya, Li Kevin Wenliang, Elliot Catt, John Reid, Tim Genewein. Grandmaster-Level Chess Without Search.

この連載を「連載記事アラート」に登録する New