一方の“GPU最強”といわれる「dlshogi」は、システムエンジニアの山岡忠夫さんがAlphaGoから刺激を受け、2017年ごろから開発を進めてきた、ディープラーニングによる将棋ソフトだ。
AlphaGoやAlphaZeroの仕組みをひも解きながら、Googleのような大規模な計算資源を使わず、ディープラーニングで個人レベルでも強い将棋AIを動かすことを目指している。
しかしdlshogiは初めから強かったわけではない。初出場した第5回電王トーナメント(17年)では一次予選で敗退。GPU環境を強化するも、18年の第28回世界コンピュータ将棋選手権では二次予選で敗退した。
dlshogiの進化のきっかけは、ライトノベル「りゅうおうのおしごと!」作者の白鳥士郎さんによるインタビューによれば、山岡さんのかつての同僚である加納邦彦さんが山岡さんに触発されて、dlshogiを参考に「GCT」という将棋ソフトの開発を始めたことにある。
dlshogiは「やねうら王の技術は使わない」という信念で山岡さんが開発を続けていた一方、GCTは学習データにそれほどのこだわりを持っていなかった。Ponanzaの参考元になった将棋ソフト「Bonanza」開発者の保木邦仁さんなどが関わるディープラーニング系将棋ソフト「AobaZero」の棋譜を学習し、序盤を強くした他、やねうら王系である水匠を仮想敵としてGCTをチューニングした。
「学習は無料の『Google Colab』環境で、本番はAWSのインスタンスで」とGCTを運用していたのも功を奏した。AWSの従来のインスタンスで借りられるGPUは「NVIDIA V100」だったが、新しいインスタンスでは最新GPU「A100」を使えることに。
「私は過去にAWSを借りた実績があったので、すんなりA100を借りることができました。けれど山岡さんは審査に落ちてしまって(苦笑)」
「じゃあチームになりましょうと。『こっちはA100の環境を提供するので、山岡さんはdlshogiの教師データをくださいよ』と……これがチームdlshogi結成のきっかけです」
(最強CPU将棋ソフト『水匠』VS最強GPU将棋ソフト『dlshogi』長時間マッチ観戦記 第三譜『GCT』加納邦彦の自信より)
こうして生まれた「チームdlshogi」によるGCTは、20年11月に開かれた「第一回電竜戦」でやねうら王系を抑えて優勝を勝ち取る。dlshogiでも6位の成績を収めた。GCTでの成果の一部はdlshogiにも反映したという。
21年7月の第二回電竜戦TSEC(TSECは「相居飛車」など特定の局面から戦いを始める方式)では水匠が優勝を収めた一方で、B級リーグでは並み居るNNUE系に対しdlshogiが圧倒的な戦績を収め、B級の総合優勝に。
当時の心境を杉村はこう語る。
「B級リーグではdlshogiが圧倒的な強さで優勝していました。だから思ったんです。長時間の対局で戦ってみたいと」
(最強CPU将棋ソフト『水匠』VS最強GPU将棋ソフト『dlshogi』長時間マッチ観戦記 第一譜『水匠』杉村達也の挑戦より)
インタビューの中でたややん(杉村)さんは「通常、将棋ソフトは2倍の時間を使って読ませると、レーティング(強さ)が100〜150ほど上がるといわれています」「持ち時間をとっても長くしてみたら、レーティングが500〜1000も上がった状態になる。そのとき、どんな棋譜が生まれるのか、見てみたかったんです」と語っている。
電竜戦プロジェクトの監事でもあるたややんさんは、ここから「CPU最強ソフトとGPU最強ソフトの長時間マッチ」の発想に至った。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR