国産の囲碁AIは、3カ月以内に“世界の壁”を破れるか? 開発者や棋士が結集、「GLOBIS-AQZ」の挑戦(2/2 ページ)

» 2019年04月25日 07時00分 公開
[柴佑佳ITmedia]
前のページへ 1|2       

世界との差を詰める切り札 「マルチエージェント学習」とは

photo 囲碁AI「AQ」開発者 山口祐氏

 現在、「GLOBIS-AQZ」の開発は、山口氏が個人開発した囲碁AI「AQ」をベースに進められている。

 AQは、全世界の囲碁AIの中でどれほど強いのか。2018年の世界大会「World AI Go Open」で準優勝したAQだが、山口氏によれば、そのレーティング(対局結果で定められる、実力の評価値)は現時点で3650程度。中国の「絶芸」のレーティングは4800、アメリカの「AlphaGo Zero(AlphaGoの最新版)」の場合は5200ほどなので、勝つべきライバルはごまんといる状況だ。

 8月までに他国の囲碁AIに追い付き、世界一を目指す――そのために山口氏が選択した方法が、「マルチエージェント学習」だ。

 マルチエージェント学習とは、自律的に学習行動を繰り返す「エージェント」を複数置く構成で行う学習のこと。その中で、対局結果の悪いエージェントを破棄し、強いエージェントを分化させることで、強化学習の効率と速度を上げる。

 しかし、囲碁AIの開発には、大規模なコンピューティング環境を要する。例えば、「AlphaGo」を通常のPC一台で再現するためには、3000年以上かかるという。

 今回のプロジェクトで、GLOBIS-AQZは、産総研の「AI橋渡しクラウド(ABCI)」の一部を占有し、強化学習を進めるために十分な環境を整備できた。

 「従来は、個人開発の限界も感じていました。(GLOBIS-AQZのプロジェクトは)先進企業と同等か、それ以上の規模に匹敵する計算資源を確保できたと考えています」と、山口氏は話す。

「AIネイティブ棋士」の誕生は目の前に

photo GLOBIS-AQZテクニカルアドバイザー 日本棋院 大橋拓文六段

 一方、日本棋院の大橋拓文六段は、「AlphaGoの登場以来、棋士の世界は激変しています。そんな中でわれわれの世界では『人機一体』を目指しています」と語る。

 大橋六段は、これまでAIを使った囲碁研究に熱心に取り組み、解説本『よくわかる囲碁AI大全』を出版。囲碁AIの環境を強化するためにAWSを取り入れるなど、積極的な試みで知られる。

 大橋六段によれば、中国や韓国の棋士は、AIとの一致率を高めることを目指す棋士が多いそうだ。日本でも、特に若い棋士は、日常的にAIを相手に学習を繰り返しているという。「強い」AIを相手にするほど、棋士としての学びも多くなるようだ。

 「今の若い棋士は、AIの打ち方をどんどんと吸収しています。ジュニアの囲碁会に顔を出すと、7、8歳の子供が囲碁ソフトの定石をどんどん打っていく。あれは衝撃的です」(大橋六段)

 大橋六段は、一人の棋士の打ち筋から「絶芸らしさ」や「AlphaGoらしさ」を感じることもあれば、人間の棋士が「AIを超える一手」を打つ場面を目の当たりにすることもあるそうだ。「人間の棋士が持つドメイン知識をAIに学習させていった先には、人間の師匠を持たず、囲碁AIだけで囲碁を学んだ“AIネイティブな棋士”が出てくる」と見込んでいる。

 AIについて、「人の仕事を奪う」「人の能力を超える」といった、人間との単純な対立構造で考えようとする人はいまだに多い。しかし囲碁の世界は、その一歩先を見据えているようだ。人間の棋士とAIが一体になって「日本代表」の知力を底上げする挑戦が、2019年8月の世界大会に向けて続いている。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ