AIサービスにおける「エージェント」とは、特定のタスクを自律的に遂行し、ユーザーの目的を支援するシステムのことだ。ユーザーとの対話を通して指示を理解し、必要に応じて外部データやリソースと連携しながら、適切なアクションを実行していく。
取材当日(2月2日)の朝、OpenAIはChatGPTに「Deep Research」を統合したことを発表した。アルトマンCEOは、DeepResearchは「世界で初めて本格的に実装されたエージェントだ」と語る。
Deep Researchは、先述のOpenAI o3-miniを活用した高度なリサーチツールだ。インターネット上の多様な情報源からデータを収集/分析し、参照資料なども添付した包括的なレポートを自動的に生成する能力を持っており、ユーザーの指示に基づいて、Web上のテキスト/画像/PDFなど複数種のメディアを横断的に探索/解析し、関連情報を統合して提示してくれる。
こうした複雑な異なる情報を参照/統合する作業を人間が行うと、数時間から数日を要する。それに対し、Deep Researchはこうした複雑なリサーチタスクを数十分以内で完了可能だ。
現段階において、Deep Researchは開発初期の段階で、情報の信頼性の判断や不確実性の表現に課題が残っていることをOpenAIも認めている。しかし、彼らはこのコンセプトをさらに拡張していくという。
その一例として、ソフトウェアのコーディングエージェントを大規模に実装する構想があるという。ユーザーの代わりにプログラムコードを書いてテストを実施し、必要に応じてバグの修正や振る舞いの調整を“自律的に”行えるようにすることを目指しているとのことだ。複数の実装エージェントを連携させるアイディアもある。エージェントは専門性の高い実装となるため、「得意分野を分けて協業する」という発想に立っている。
そして、エージェントによる自律的な動きの中に、どのようにして人間の判断を介入させて、安全性を保証するかについても研究開発を行っている。エージェントに完全な自律性を与えると、安全性や誤作動などのリスクがあるため、人間が関与すべきタイミングを適切に判別し、「どこまで自律的に進めさせるか?」「いつユーザーに確認を求めるか?」を適切に設計することが重要だとアルトマンCEOは話る。
複雑なAIの使いこなしをエージェントが肩代わりすることで、ユーザーとAIの距離はさらに小さくなっていくだろう。これによって「生産性の向上が見込める」という考え方もあるが、「目的を達成するためのハードルを下げる」「リテラシーのギャップによる情報格差を縮小する」といった効果も期待できる。
ただし、こうしたAIエージェントが進化するためには、同時にAIモデルの進化も不可欠となる。その上で最も大きな課題となるのが情報ソースの「マルチモーダル化」だ。
より高性能なモデルへの進化に併せて、音声や画像など情報をマルチモーダルに分析する機能を組み合わせることで、エージェントはより強力なものとなり、応用の範囲も広がっていくだろう。
アルトマンCEOは「今後のモデルでは『より長い時間を要する複雑な問いに対して簡単に回答をする』のではなく、『もっと良い答えがあるかもしれない』と“考え続ける”ようになる。これにより、科学的/技術的にも新しい発見や成果を生み出す可能性がある」と語る。AIエージェントが“新たな発見”を促す効果をもたらす可能性を示した格好だ。
これを実現するには、外部データとの接続が重要になる。つまりエージェントが収集し、AIモデルを駆使してリサーチしやすくなるよう、他サービスなどとAPIで連携する方法を整備する必要があるということだ。
OpenAIが新モデル「o1」を発表 より複雑な問題の解答にも対応
OpenAIが日本法人を設立 日本語に最適化したGPT-4カスタムで3倍速く/Microsoft Edgeの更新で「Microsoft Copilot」アプリが導入される不具合
一部組織では利用禁止も! OpenAIの「ChatGPT」のスゴさとMicrosoftの戦略
「ChatGPT」で話題 MicrosoftとOpenAIの関係と目指すものを整理
元OpenAIのアルトマンCEOとブロックマン氏がMicrosoftにCopyright © ITmedia, Inc. All Rights Reserved.