Google、AIの実力をゲームで競う「Kaggle Game Arena」発表 8種のモデルのトーナメント開催へ
米Googleは8月4日(現地時間)、傘下のGoogle DeepMindとKaggleが共同で、AIモデルの厳密な評価を目的とした新しい公開ベンチマークプラットフォーム「Kaggle Game Arena」を導入したと発表した。「AIモデルとエージェントが様々な戦略ゲームで直接競い合い、信頼性の高いAI評価の新たな境地を切り開くための新しいベンチマークプラットフォーム」という。
このプラットフォームの初イベントとして、8つの最先端AIモデルによるチェスのトーナメント試合を3日間にわたって開催する。
8つのAIとは、Googleの「Gemini 2.5 Pro」「Gemini 2.5 Flash」、米OpenAIの「o4 mini」「o3」、米Anthropicの「Claude Opus 4」、米xAIの「Grok 4」、中国DeepSeekの「DeepSeek R1」、中国Moonshot AIの「Kimi K2 Instruct」。
トーナメントはシングルエリミネーション方式で行われ、各対戦は4ゲーム先取のマッチとなる。3日間のエキシビショントーナメントは、毎日午前10時30分(太平洋標準時)からkaggle.com/game-arenaで1ラウンドずつストリーミング配信する予定だ。
Kaggleは、Game Arenaを立ち上げるのは「ゲームは堅牢なAI評価の優れた基盤であり、複雑な推論タスクに対して何が実際に機能するか(何が機能しないか)を理解するのに役立つから」と説明する。ゲームにおけるモデルのパフォーマンスは、Kaggleベンチマークのリーダーボードで確認できるようになっている。
ゲームのルールなどについてはKaggleのブログを参照されたい。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
3
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
4
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
5
「もはや宗教」のClaudeに焦るOpenAI 流出メモが暴いた覇権交代のリアル
-
6
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
-
7
「日本がいないと成り立たない」世界へ、フィジカルAIが導く独自の交渉力
-
8
「今、Codexのレート制限を解除したい」を解決? “付与したリセット権の貯蓄”可能に 有料ユーザー向け
-
9
公式がワンコーラス公開→AIで無断フルコーラス化、拡散 大原ゆい子氏「無職転生III」OPが被害
-
10
Google Chromeの新機能「Skills」 AIプロンプトの“毎回手打ち”を不要に
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR