米Google DeepMindは11月13日(現地時間)、次世代の汎用AIエージェント「SIMA 2」の研究プレビューを公開した。昨年3月に公開した、自然言語の指示でゲーム内のタスクを実行するAIエージェント「SIMA」のアップグレード版だ。
SIMAは、幅広い仮想環境で基本的な指示に従うことができる汎用AIとして導入されたが、SIMA 2は、Google DeepMindのAIモデルである「Gemini」の機能を統合することで、単なる指示実行者から、思考し、ユーザーと対話し、時間をかけて自己改善できるインタラクティブなゲームコンパニオンへと進化したとしている。
Geminiモデルがエージェントの核として埋め込まれたことで、SIMA 2は、強力な推論能力を活用し、ユーザーのハイレベルな目標を理解し、複雑な推論を実行することが可能になったという。これにより、SIMA 2は次に何をしようとしているかをユーザーに説明したり、目標達成のために踏んでいる手順を詳細に伝えたりすることもできる。
SIMA 2は、推論能力の向上に加え、汎化性能と信頼性において飛躍的な進歩を遂げた。前身のSIMAが600以上の言語指示スキルを学習したのに対し、SIMA 2はより複雑で微妙なニュアンスの指示を理解し、訓練を受けたことのないゲーム(例えば、新しいバイキングサバイバルゲーム「ASKA」や、「マインクラフト」の研究実装である「MineDojo」など)でも、タスク実行の成功率が格段に上がった。
複数のゲームにわたって学習した概念を転用する能力が基盤となり、SIMA 2のタスク完了成功率は、評価タスク全体で人間のパフォーマンスとのギャップを大幅に縮めた。さらに、自己改善能力が改善され、Geminiベースのフィードバックと試行錯誤を通じて、人間の入力なしで、以前失敗したタスクを完全に独立して改善できるようになった。
Google DeepMindは、SIMA 2の多様なゲーム環境で動作する能力が汎用知能にとって極めて重要な試金石であり、人工汎用知能(AGI)に向けた重要な一歩と位置づけている。SIMA 2は、多様なマルチワールドデータとGeminiの強力な推論を活用することで、多くの専門システムを1つの首尾一貫した汎用エージェントに統合できることを裏付けており、物理世界における将来のAIアシスタントに必要なナビゲーションやツール使用などのスキルを学ぶことで、ロボティクスへの応用にも強力な道筋を示していると同社はみている。
SIMA 2は現在、限定的な研究プレビューとして、少数の研究者およびゲーム開発者に提供されている。
Microsoft AI、超知能研究チーム立ち上げ スレイマンCEOは「AGI競争」を否定
Google DeepMind、AIで核融合の商業化を加速 CFSとの提携で
Google DeepMind、リアルタイムで世界を生成するAI「Genie 3」発表 “AGIへの足がかり”
Google DeepMind、9種のゲームでトレーニングしたAIエージェント「SIMA」発表Copyright © ITmedia, Inc. All Rights Reserved.