そこで将棋AI「Bonanza」開発者の保木邦仁さんが、人間の棋譜からAIが自動的にパラメータを調整する「最適制御理論」を発表。さらにその後、機械学習でもよく使われる手法「確率的勾配降下法」でもパラメータを調整できることが判明し、評価関数の自動調整が進んでいった。
これにより、一般的な機械学習の枠組みでも将棋AIの調整が可能に。さらに進化を続けた結果13年には、冒頭でも言及した通りAIのponanzaがプロ棋士相手に勝利を収めた。このponanzaもαβ法と機械学習による評価関数パラメータの自動調整を利用していたという。
その後も、高額な賞金を出す将棋AIの世界大会の出現や、やねうら王のオープンソース化など、環境的な要因も手伝って、将棋AIはさらなる発展を遂げていく。そんな将棋AIには現在、大きく分けて2種類のモデルがあるという。
1つは水匠など「NNUE評価関数」を組み込んだモデルと、もう1つは「ディープラーニング」を用いたモデルだ。24年時点ではどちらのモデルも拮抗した実力を持ち、同様に世界大会で活躍しているという。
前者は、従来の将棋AI開発の流れを引き継ぐもので、NNUE評価関数を搭載している。NNUE評価関数とは、3層程度のニューラルネットワークで構成した評価関数で、CPUで高速に動作できるのが特徴だ。これにより、従来の将棋AIよりも計算効率が向上。プロ棋士の棋譜ではなく、将棋AIが自動生成した棋譜データの学習が主流になるのも相まって発展していった。
Copyright © ITmedia, Inc. All Rights Reserved.