Google DeepMind、汎用AIエージェント「SIMA 2」 AGIに向けた重要な一歩
米Google DeepMindは11月13日(現地時間)、次世代の汎用AIエージェント「SIMA 2」の研究プレビューを公開した。昨年3月に公開した、自然言語の指示でゲーム内のタスクを実行するAIエージェント「SIMA」のアップグレード版だ。
SIMAは、幅広い仮想環境で基本的な指示に従うことができる汎用AIとして導入されたが、SIMA 2は、Google DeepMindのAIモデルである「Gemini」の機能を統合することで、単なる指示実行者から、思考し、ユーザーと対話し、時間をかけて自己改善できるインタラクティブなゲームコンパニオンへと進化したとしている。
Geminiモデルがエージェントの核として埋め込まれたことで、SIMA 2は、強力な推論能力を活用し、ユーザーのハイレベルな目標を理解し、複雑な推論を実行することが可能になったという。これにより、SIMA 2は次に何をしようとしているかをユーザーに説明したり、目標達成のために踏んでいる手順を詳細に伝えたりすることもできる。
SIMA 2は、推論能力の向上に加え、汎化性能と信頼性において飛躍的な進歩を遂げた。前身のSIMAが600以上の言語指示スキルを学習したのに対し、SIMA 2はより複雑で微妙なニュアンスの指示を理解し、訓練を受けたことのないゲーム(例えば、新しいバイキングサバイバルゲーム「ASKA」や、「マインクラフト」の研究実装である「MineDojo」など)でも、タスク実行の成功率が格段に上がった。
複数のゲームにわたって学習した概念を転用する能力が基盤となり、SIMA 2のタスク完了成功率は、評価タスク全体で人間のパフォーマンスとのギャップを大幅に縮めた。さらに、自己改善能力が改善され、Geminiベースのフィードバックと試行錯誤を通じて、人間の入力なしで、以前失敗したタスクを完全に独立して改善できるようになった。
Google DeepMindは、SIMA 2の多様なゲーム環境で動作する能力が汎用知能にとって極めて重要な試金石であり、人工汎用知能(AGI)に向けた重要な一歩と位置づけている。SIMA 2は、多様なマルチワールドデータとGeminiの強力な推論を活用することで、多くの専門システムを1つの首尾一貫した汎用エージェントに統合できることを裏付けており、物理世界における将来のAIアシスタントに必要なナビゲーションやツール使用などのスキルを学ぶことで、ロボティクスへの応用にも強力な道筋を示していると同社はみている。
SIMA 2は現在、限定的な研究プレビューとして、少数の研究者およびゲーム開発者に提供されている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
2
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
3
キオクシア社長「記録的な増収増益」 3カ月の売上収益1兆円、純利益は2990%増 好決算の背景は
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
6
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
7
NEC社長が説く AI時代と新たな安全保障環境の到来で「ITサービスはこう変わる」
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
10
Python 3.15に追加されるlazy importと内包表記でのアンパッキングについて調べてみた
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR