メディア
ITmedia AI+ >

Google、AIの実力をゲームで競う「Kaggle Game Arena」発表 8種のモデルのトーナメント開催へ

» 2025年08月05日 10時05分 公開
[ITmedia]

 米Googleは8月4日(現地時間)、傘下のGoogle DeepMindとKaggleが共同で、AIモデルの厳密な評価を目的とした新しい公開ベンチマークプラットフォーム「Kaggle Game Arena」を導入したと発表した。「AIモデルとエージェントが様々な戦略ゲームで直接競い合い、信頼性の高いAI評価の新たな境地を切り開くための新しいベンチマークプラットフォーム」という。

 このプラットフォームの初イベントとして、8つの最先端AIモデルによるチェスのトーナメント試合を3日間にわたって開催する。

 8つのAIとは、Googleの「Gemini 2.5 Pro」「Gemini 2.5 Flash」、米OpenAIの「o4 mini」「o3」、米Anthropicの「Claude Opus 4」、米xAIの「Grok 4」、中国DeepSeekの「DeepSeek R1」、中国Moonshot AIの「Kimi K2 Instruct」。

 kaggle トーナメント(画像:Kaggle)

 トーナメントはシングルエリミネーション方式で行われ、各対戦は4ゲーム先取のマッチとなる。3日間のエキシビショントーナメントは、毎日午前10時30分(太平洋標準時)からkaggle.com/game-arenaで1ラウンドずつストリーミング配信する予定だ。

 Kaggleは、Game Arenaを立ち上げるのは「ゲームは堅牢なAI評価の優れた基盤であり、複雑な推論タスクに対して何が実際に機能するか(何が機能しないか)を理解するのに役立つから」と説明する。ゲームにおけるモデルのパフォーマンスは、Kaggleベンチマークのリーダーボードで確認できるようになっている。

 ゲームのルールなどについてはKaggleのブログを参照されたい。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ