ソニーがグランツーリスモ攻略AI発表、強さと“マナー”を両立 トップ選手「初めて勝ちたいと思えた」 アップデートで一般提供予定
ソニーAIとSIE、ポリフォニー・デジタルの3社が、ゲーム「グランツーリスモ」で世界トップランカーにも勝てるAIを開発した。ただ勝つだけでなく、レースマナーを守りながら走れるのが特徴だ。
「初めてAIに勝ちたいと思えた」――カーレースゲーム「グランツーリスモ」の世界大会で優勝経験を持つ山中智瑛選手は、ソニーが開発したレースAI「グランツーリスモ・ソフィー」と対戦してそう語った。
ソニーグループのソニーAIとソニー・インタラクティブエンタテインメント(SIE)、SIE子会社のポリフォニー・デジタルは2月10日、「深層強化学習でグランツーリスモのチャンピオンドライバーを凌駕(りょうが)する」という論文が、同日付で英科学誌Natureに掲載されたと発表した。同号の表紙も飾っている。
この論文の研究成果であるレースAIのソフィーは、ただ勝つだけでなく、レースにおけるマナーを守りながら世界トップランカー以上のパフォーマンスを見せることを目指して開発されたAIだ。
AIの学習にはSIEが持つクラウドゲーミング用のインフラを活用。グランツーリスモを多重起動して学習の試行回数を確保した。ソフィーは対戦相手の動きや車両の空気抵抗などの状況から、ステアリングやブレーキの操作を学習していった。
ソフィーがコースを走れるようになるまでに1日、人間の上位5%に匹敵するスコアを出すまでに2日、トップランカーレベルになるまでにさらに10〜12日間かかるという。1コース当たりの学習でソフィーは合計約30万kmを走行する。
人間には勝てるがマナーが悪かったソフィー
2021年7月と10月にはトップ選手4人とソフィー4体が直接対戦。7月は人間チームが勝ったが、10月にはソフィーが人間に全試合で1位を獲得。ダブルスコアを付けて優勝した。
当時のソフィーは、人間を超える圧倒的な速さでレースに勝ったものの、人間はしないような常識的でないプレイングをしており、レースマナー、選手へのリスペクトの面で進化が必要だったという。
最新のソフィーは、速く走るテクニックに加えてレーシングエチケットも学習。好戦的なレースをしながらフェアプレーを守るようバランスを調整した結果、マナーを守りながら相手を追い越せるようになった。
2月10日のエキシビションマッチでは、トップレーサー4人とソフィー4体が対戦。レースは、3番手に付けたソフィーが2番手の選手を終始攻めつつ、4番手の選手の攻撃を押さえ込むコース取りで展開。カーブでは人間以上にインコースギリギリを攻めたが、実況によると「無理に行こうとしていないところが、マナーの面で成長を感じられる」「10月のときはさらにインに入ってきていた」という。結果はソフィーが1着、人間が2着となった。
2着に入った山中選手は「正直悔しい。今までAIと戦ってきた中ではなかった感情。今回初めてAIに勝ちたい、絶対に抜かせたくないという感情が出てきたのは、ソフィーが人間らしく、良きライバルとして走れたから」と評価した。
「人と互いに学び合う存在に」
ポリフォニー・デジタルの山内一典社長はソフィーの開発コンセプトについて次のように語った。
「単に人間に勝つだけではつまらない。プレイヤーにとって友達や仲間、相棒のような、共感を得るような、互いに学び合う存在になってほしい。人の心を揺さぶり、互いにリスペクトでき、人間にとってポジティブな効果をもたらすものであってほしい」
ソフィーの開発では、人間と同等かそれ以上に速いこと、レース中で常に妥当な振る舞いを見せること、人間から見て自然に思えることを重視したという。
今後は、AIが意味や意図を持っているような振る舞いを見せること、人を啓発するような創造性を持たせること、倫理性を感じさせるものを目指すとしている。ソフィーの技術は「中期的には、他のゲームスタジオにもパートナーシップを広げていきたい」(山内社長)という。
アップデートで提供予定
ソフィーは今後グランツーリスモ7のアップデートでプレイヤーに提供する予定。「ソフィーはプレイヤーにドライブを教えるコーチ、プレイヤーから人間性を学ぶ生徒、一緒にレースをする友達として提供する」(山内社長)としている。
現在はソフィーとの対戦の難易度調整を研究中で、具体的な実装時期は未定。山内社長によると「どうやって人を楽しませるのかということが直近の課題。あらゆる状況に応じて人と一緒に楽しむようなAIになる」という。
関連記事
- AIが競技プログラミングに挑戦、人間レベルのスコア達成 英DeepMindの「AlphaCode」
英DeepMindのプログラミングAI「AlphaCode」が、競技プログラミングコンテストで参加者の上位54%以内に食い込む成績を収めた。プログラミングAIがコンテストで人間と渡り合えるレベルに達したのは初という。 - プロ棋士向け最強将棋AIマシンを組む! ある相談から全てが始まった
「ディープラーニング系の将棋ソフトを使いたい」──広瀬章人八段のこんな相談から、ITmedia NEWSの新しい連載が始まった。 - DeepMind、ルールを教えなくても「パックマン」などでハイスコアを出せるAIシステム「MuZero」
Alphabet傘下のDeepMindが、ゲームのルールを教えなくても囲碁や将棋、Atariの「パックマン」などで強さを見せる新しいAIシステム「MuZero」を発表した。新たな動画圧縮技術の開発他、複雑な問題解決に応用していくとしている。 - 「AlphaGo」と対戦したプロ棋士・李世ドル氏が引退 「囲碁AIには勝てない」
米Google傘下のDeepMindが開発した囲碁AI「AlphaGo」と対戦した、韓国のプロ棋士・李世ドル氏が引退。韓国メディアのインタビューに対し、囲碁AI「必死に努力してナンバー1になっても、トップではないことが分かった」と語ったという。 - 「わざと負けようとしても無理」と話題 プロも挑戦する“世界最弱のオセロAI”、生みの親に聞く開発の裏話
AIベンチャーのAVILENが、強化学習を使ってAIを極限まで弱くしたブラウザゲーム「最弱オセロ」をリリース。AIが対局中に「あえて角を取らない」「石を少なく取る」といった行動を取り続けるため、人間は負けることが難しいゲームだ。生みの親である吉田拓真CTOに、開発した経緯を聞いた。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.