現在、「GLOBIS-AQZ」の開発は、山口氏が個人開発した囲碁AI「AQ」をベースに進められている。
AQは、全世界の囲碁AIの中でどれほど強いのか。2018年の世界大会「World AI Go Open」で準優勝したAQだが、山口氏によれば、そのレーティング(対局結果で定められる、実力の評価値)は現時点で3650程度。中国の「絶芸」のレーティングは4800、アメリカの「AlphaGo Zero(AlphaGoの最新版)」の場合は5200ほどなので、勝つべきライバルはごまんといる状況だ。
8月までに他国の囲碁AIに追い付き、世界一を目指す――そのために山口氏が選択した方法が、「マルチエージェント学習」だ。
マルチエージェント学習とは、自律的に学習行動を繰り返す「エージェント」を複数置く構成で行う学習のこと。その中で、対局結果の悪いエージェントを破棄し、強いエージェントを分化させることで、強化学習の効率と速度を上げる。
しかし、囲碁AIの開発には、大規模なコンピューティング環境を要する。例えば、「AlphaGo」を通常のPC一台で再現するためには、3000年以上かかるという。
今回のプロジェクトで、GLOBIS-AQZは、産総研の「AI橋渡しクラウド(ABCI)」の一部を占有し、強化学習を進めるために十分な環境を整備できた。
「従来は、個人開発の限界も感じていました。(GLOBIS-AQZのプロジェクトは)先進企業と同等か、それ以上の規模に匹敵する計算資源を確保できたと考えています」と、山口氏は話す。
一方、日本棋院の大橋拓文六段は、「AlphaGoの登場以来、棋士の世界は激変しています。そんな中でわれわれの世界では『人機一体』を目指しています」と語る。
大橋六段は、これまでAIを使った囲碁研究に熱心に取り組み、解説本『よくわかる囲碁AI大全』を出版。囲碁AIの環境を強化するためにAWSを取り入れるなど、積極的な試みで知られる。
大橋六段によれば、中国や韓国の棋士は、AIとの一致率を高めることを目指す棋士が多いそうだ。日本でも、特に若い棋士は、日常的にAIを相手に学習を繰り返しているという。「強い」AIを相手にするほど、棋士としての学びも多くなるようだ。
「今の若い棋士は、AIの打ち方をどんどんと吸収しています。ジュニアの囲碁会に顔を出すと、7、8歳の子供が囲碁ソフトの定石をどんどん打っていく。あれは衝撃的です」(大橋六段)
大橋六段は、一人の棋士の打ち筋から「絶芸らしさ」や「AlphaGoらしさ」を感じることもあれば、人間の棋士が「AIを超える一手」を打つ場面を目の当たりにすることもあるそうだ。「人間の棋士が持つドメイン知識をAIに学習させていった先には、人間の師匠を持たず、囲碁AIだけで囲碁を学んだ“AIネイティブな棋士”が出てくる」と見込んでいる。
AIについて、「人の仕事を奪う」「人の能力を超える」といった、人間との単純な対立構造で考えようとする人はいまだに多い。しかし囲碁の世界は、その一歩先を見据えているようだ。人間の棋士とAIが一体になって「日本代表」の知力を底上げする挑戦が、2019年8月の世界大会に向けて続いている。
Copyright © ITmedia, Inc. All Rights Reserved.