ITmedia NEWS > 科学・テクノロジー >
ITmedia AI+ AI活用のいまが分かる

AIがチームを組み、ゲーム攻略するシステム 中国チームが開発 マインクラフトなどで実験Innovative Tech

» 2023年09月05日 08時00分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

Twitter: @shiropen2

 中国の清華大学、北京郵電大学、テンセントなどに所属する研究者らが発表した論文「AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents」は、さまざまなタスクを複数のエージェント(大規模言語モデルで駆動する自律AI)がメンバーを変えて協力して解決するシステムを提案した研究報告である。

 ソフトウェアの開発やゲームの攻略など、特定のタスクに応じて専門家エージェントを入れ変えて実行することで、多様な課題への応用が可能であることを示した。

自律AIが共同作業しているイメージ図

 米スタンフォード大学などの研究者らが発表した「Generative Agents」は、エージェントのグループ内での協力的な行動が現れることを発見した。また別の研究では、複数のエージェントが組み合わさることで、協力的な問題解決中の意思決定能力が向上することも特定している。

 これらの研究はエージェント同士の協力の可能性を示唆しているが、グループの構成が静的であり、エージェントのアイデンティティーや能力がグループ内で一定であるため、多様な課題への対応が難しいという課題が指摘されている。

 この問題を解決するために、この研究では「AgentVerseフレームワーク」を導入する。このフレームワークは、人間のグループの問題解決手順を模倣し、進行中の問題解決の状況に応じて、グループメンバーを動的に調整する能力を持つ。

 具体的に、AgentVerseはグループの問題解決プロセスを以下の4つの段階に分けて取り組む。

(1)専門家の募集──問題解決の進行に応じて、最も適切なエージェントがタスクに参加するよう選出・調整される。

(2)協力的意思決定──タスクに参加する専門家エージェントたちは、提示された問題を解決するための戦略を共同で議論する。

(3)アクションの実行──エージェントは環境とのインタラクションを通じて、具体的な行動を取る。

(4)評価──行動の実行後、達成された結果と目標とのギャップを検討・評価する。もし現在の状態が期待に応えられない場合、フィードバック報酬が最初の段階に送られ、次回の協力のためにグループの構成が動的に調整される。

AgentVerseのシステム概要図

 実験の中では、エージェントは2つの異なる大規模言語モデル「GPT-3.5-Turbo」と「GPT-4」によって動かされる。実験の結果では、マルチエージェントのグループは、GPT-3.5-TurboやGPT-4を使用する場合でも、単独のエージェントよりも一貫して性能が上だったことを確認できた。

 デモンストレーションでは、ソフトウェア設計やゲーム攻略(例:ポケモンやMicrosoftなど)、テキストの評価、データベースの管理などを示し、その汎用性の高さを強調した。

マインクラフトを協力して攻略していく様子を表した図

Source and Image Credits: Chen, W., Su, Y., Zuo, J., Yang, C., Yuan, C., Qian, C., … & Zhou, J.(2023). AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents. arXiv preprint arXiv:2308.10848.



Copyright © ITmedia, Inc. All Rights Reserved.