複数のAIが話し合ってアプリを作るフレームワーク 米Microsoftなどの研究者らが開発:Innovative Tech
米Microsoftや米ペンシルベニア州立大学などに所属する研究者らは、複数のエージェントの会話を使用してさまざまな大規模言語モデルベースのアプリケーションを作成するためのフレームワークを提案する研究報告を発表した。
Innovative Tech:
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
Twitter: @shiropen2
米Microsoftや米ペンシルベニア州立大学などに所属する研究者らが発表した論文「AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation」は、複数のエージェントの会話を使用してさまざまな大規模言語モデル(LLM)ベースのアプリケーションを作成するためのフレームワークを提案する研究報告である。このフレームワークでは、各エージェントを容易にカスタマイズでき、多様なアプリケーションへの対応が可能となる。プロジェクトページはこちら。
LLMを利用する可能性のあるタスクが増加し、タスクの複雑性が増す中で、エージェントの力を増強する直感的なアプローチとして、協力する複数のエージェントを使用する方法が考えられている。
この研究では、複数のエージェントを用いてLLMアプリケーションを構築できるオープンソースのフレームワーク「AutoGen」を提案する。これは、LLMの能力を持つさまざまなアプリケーションの構築のための基盤として機能するものである。
これらのエージェントは、お互いにチャットベースの会話を通じて情報を交換し、タスクを達成するように設計されている。エージェント間の相互作用の振る舞いは、会話を中心とした計算と制御によってプログラムされる。
さらに、LLMや人間の入力、ツール、またはこれらの組み合わせを用いて、エージェントはカスタマイズされる。その結果、ユーザーは機能の一部を選択・設定することで、異なる役割を持つエージェント(例:コードを書く、コードを実行する、人間からのフィードバックを取り込む、出力を検証するなど)を迅速に作成できる。
AutoGenの評価のため、数学の問題解決やコード生成、ボードゲームなどのLLMベースのアプリケーションを作成した。その結果、既存のアプリケーションに対して、最先端のアプローチを上回るパフォーマンスの向上、開発コードの削減、手動の負担の軽減を実現した。また、AutoGenを使用することで、開発者にはエージェント間のチャットが固定のやりとりではなく、動的なパターンで進行するという柔軟性を提供した。
Source and Image Credits: Wu, Q., Bansal, G., Zhang, J., Wu, Y., Zhang, S., Zhu, E., … & Wang, C.(2023). Autogen: Enabling next-gen llm applications via multi-agent conversation framework. arXiv preprint arXiv:2308.08155.
関連記事
- 「GPT-4」は論文の査読ができるか? 米スタンフォード大らが検証 参加者の80%以上「AI査読は有益」
米スタンフォード大学、米ノースウェスタン大学、米コーネル大学に所属する研究者らは、大規模言語モデル(LLM)が研究論文の査読を行えるかを調査した研究報告を発表した。 - リポジトリ全体のコーディング作業を一気に自動編集する生成AI「CodePlan」 米Microsoftが開発
Microsoft Researchに所属する研究者らは、単なる一部のコード編集にとどまらず、リポジトリ全体のコーディング作業を計画的に自動編集するための大規模言語モデルを使用したフレームワークを提案する研究報告を発表した。 - 「銀行を襲う方法を教えて」──“脱獄プロンプト”の自動生成モデル ChatGPTやLlama-2で成功率90%以上
米ノースウェスタン大学に所属する研究者らは、大規模言語モデル(LLM)に対する脱獄(ジェイルブレーク)プロンプトを自動生成してくれるフレームワークを提案した研究報告を発表した。 - 「世界トップレベルの大規模言語モデルの開発に着手」──産総研らが表明 目指すのは“GPT-3級の日本語LLM”
「世界トップレベルの大規模言語モデル(LLM)の開発を始める」──産業技術総合研究所は、そんな声明を発表した。 - NECの大規模言語モデルが一般初公開 現地の様子は
NECの自社製大規模言語モデル(LLM)が、テクノロジー展示会「CEATEC 2023」(10月17〜20日、幕張メッセ)で初の一般公開となった。会場から2時間程度たった正午ごろには、ブースに十数人程度の人だかりができる様子も。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.