CEDEC 2024
人間のさらにその先へ──将棋AIはまだ強くなれるのか? 「水匠」と「やねうら王」の開発者が語る“歴史と未来”(1/3 ページ)
2013年、将棋AI「ponanza」がプロ棋士の佐藤慎一六段(当時四段)を下し、AIが対プロ棋士の公式戦で初めて勝利を収めた。それから11年、将棋AIが人間より強いという認識は一般的になり、AIを使った戦法の研究や、AIが予想した次の一手を表示する対局中継なども盛んに行われるようになった。
一見、その地位を盤石にし、もはや成長の余地はないように思われる将棋AI。しかし内実は異なるという。これまで将棋AIはどのように強くなってきたのか、そしてこれからどのように強くなっていくのか?――ゲーム開発者向けカンファレンス「CEDEC 2024」(パシフィコ横浜、8月21~23日)で、将棋AIの開発者である杉村達也さん(たややんさん)とやねうらおさんが、将棋AIの仕組みや歴史、現状を整理し、その未来について語った。
杉村さんは将棋AI「水匠」の開発者。水匠は「世界コンピュータ将棋オンライン大会(2020年)」「第3回世界将棋AI電竜戦(2022年)」といった将棋AIの世界大会で優勝したモデルであり、多くのプロ棋士も使用している。やねうらおさんは将棋AI 「やねうら王」の開発者。やねうら王は、オープンソース将棋AIのデファクトスタンダードで、水匠もその一部を利用している。
将棋AIはいかにして強くなったのか?
最も古い将棋AIは1974年、早稲田大学政治経済学術院教授であり、コンピュータ将棋協会副会長を務める瀧澤武信さん(当時大学院生)が開発した。これは簡素な「評価関数」と「ミニマックス法」という探索アルゴリズムを組み合わせたものだったという。
評価関数とは、盤上にある駒の枚数や配置などから、先手と後手、どちらがどれくらい勝ちやすいか(負けやすいか)を数値にして返す関数のこと。ミニマックス法は、この評価関数を使って最善手を探し出すアルゴリズムだ。例えば、相手の手番では値が最も小さくなる(=最も負けにくい)指し手を、自分の手番では最も大きくなる(=最も勝ちやすい)指し手を考える。
将棋AIの黎明期には、このミニマックス法より少ない局面を調べるだけで同様の結果を出せる「αβ法」が出現。モデルを軽量化して効率を高める「枝刈り」という手法も発展し、探索アルゴリズムは進化していった。
一方、評価関数はどのように進化していったのか。もともと評価関数では、飛車は500点、角は300点のように人間の手でパラメータを決め、どれくらい有利か不利かを算出していた。実際の対局で評価関数の精度を確認し、パラメータの調整を繰り返していたものの、評価関数が発展していくに連れて扱うパラメータの数が増え、人間の手で調整するのは不可能になった。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
NRIセキュア、未公表の脆弱性を「Mythosと同等のレベルで」検出する診断サービス提供
-
2
OpenAIが明かす、新職種「FDE」の実態 半年で様変わり、「仕事の7割が消滅」したことも
-
3
日立、メインフレーム事業から撤退へ ハード製造終了から9年後の決断
-
4
国産AI「Sakana Fugu」なぜドル建て? 円建てニーズ「受け止める」とSakana AI
-
5
業務でAIを使う人の約38%「禁止されても利用継続」 セキュリティ企業が調査
-
6
Claude Codeに指示を出す「7つの方法」と使い分け 公式が解説
-
7
Sakana AI、一部「ミュトス越えの性能」うたうAIを提供 複数モデルの“集合知”を活用
-
8
Excelの10万行データを3分でAIに処理させる、M365 Copilotの使い方
-
9
ループエンジニアリングとは? チャットとAIコーディングの往復から卒業する新しい開発スタイル
-
10
国産フルスクラッチAI「PLaMo 3.0 Prime」提供開始、“高コスパ”うたう 無料のAPIプランも PFN
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR