人間のさらにその先へ──将棋AIはまだ強くなれるのか？　「水匠」と「やねうら王」の開発者が語る“歴史と未来”：CEDEC 2024（1/3 ページ）

» 2024年08月30日 15時31分公開

　2013年、将棋AI「ponanza」がプロ棋士の佐藤慎一六段（当時四段）を下し、AIが対プロ棋士の公式戦で初めて勝利を収めた。それから11年、将棋AIが人間より強いという認識は一般的になり、AIを使った戦法の研究や、AIが予想した次の一手を表示する対局中継なども盛んに行われるようになった。

　一見、その地位を盤石にし、もはや成長の余地はないように思われる将棋AI。しかし内実は異なるという。これまで将棋AIはどのように強くなってきたのか、そしてこれからどのように強くなっていくのか？――ゲーム開発者向けカンファレンス「CEDEC 2024」（パシフィコ横浜、8月21～23日）で、将棋AIの開発者である杉村達也さん（たややんさん）とやねうらおさんが、将棋AIの仕組みや歴史、現状を整理し、その未来について語った。

杉村達也さん（左）とやねうらおさん（右）

　杉村さんは将棋AI「水匠」の開発者。水匠は「世界コンピュータ将棋オンライン大会（2020年）」「第3回世界将棋AI電竜戦（2022年）」といった将棋AIの世界大会で優勝したモデルであり、多くのプロ棋士も使用している。やねうらおさんは将棋AI 「やねうら王」の開発者。やねうら王は、オープンソース将棋AIのデファクトスタンダードで、水匠もその一部を利用している。

将棋AIはいかにして強くなったのか？

　最も古い将棋AIは1974年、早稲田大学政治経済学術院教授であり、コンピュータ将棋協会副会長を務める瀧澤武信さん（当時大学院生）が開発した。これは簡素な「評価関数」と「ミニマックス法」という探索アルゴリズムを組み合わせたものだったという。

　評価関数とは、盤上にある駒の枚数や配置などから、先手と後手、どちらがどれくらい勝ちやすいか（負けやすいか）を数値にして返す関数のこと。ミニマックス法は、この評価関数を使って最善手を探し出すアルゴリズムだ。例えば、相手の手番では値が最も小さくなる（＝最も負けにくい）指し手を、自分の手番では最も大きくなる（＝最も勝ちやすい）指し手を考える。

評価関数を使って最善手を探し出す「ミニマックス法」

　将棋AIの黎明期には、このミニマックス法より少ない局面を調べるだけで同様の結果を出せる「αβ法」が出現。モデルを軽量化して効率を高める「枝刈り」という手法も発展し、探索アルゴリズムは進化していった。

　一方、評価関数はどのように進化していったのか。もともと評価関数では、飛車は500点、角は300点のように人間の手でパラメータを決め、どれくらい有利か不利かを算出していた。実際の対局で評価関数の精度を確認し、パラメータの調整を繰り返していたものの、評価関数が発展していくに連れて扱うパラメータの数が増え、人間の手で調整するのは不可能になった。