「ChatGPT」の新機能「ChatGPT agent」が登場した。サム・アルトマン氏が「AGIを感じる」とアピールするその特徴とは。
この記事は会員限定です。会員登録すると全てご覧いただけます。
OpenAIは2025年7月17日(現地時間)、ユーザーの指示に基づいて自ら思考し、Webブラウジングやデータ分析などのアクションを自律的に実行する「ChatGPT agent」を発表した。同社の既存技術「Operator」と「deep research」を統合し、より高度なタスクの自動化を目指す。
ChatGPT Agentは「カレンダーを確認して、最近のニュースに基づき今後のクライアントとの会議について説明してほしい」や「競合他社3社を分析してスライドショーを作成してほしい」といった自然言語での指示を受け、必要なタスクを自律的に実行する。
OpenAIのCEO(最高経営責任者)、サム・アルトマン氏はXで「ChatGPT agentがPCを操作して複雑なタスクを実行するのを見るのは、私にとって本当に『AGI(汎用<はんよう>人工知能)を感じる』瞬間でした」と述べ、同社の製品がAGIに近づいていることをアピールした。
Webサイトの閲覧、フォームへの入力、スライドショーやスプレッドシートの作成といった一連の作業を、人間のようにWebブラウザを操作しながらこなせる。フォームの送信や購入といった重要な操作の前にはユーザーに許可を求めるなど、人間が主導権を掌握できるように配慮されているという。エージェントの処理を中断し、ユーザーがAIの操作を引き継ぐこともできる。
この新機能は、OpenAIがこれまで開発してきた2つの技術の「必然の進化」だと同社は説明する。
OperatorはWeb操作にたけていたが詳細な分析は苦手で、deep researchは高度な分析が可能だったがWebサイトとのインタラクティブなやり取りはできなかった。ChatGPT agentはこの2つを組み合わせて、より複雑で動的なタスクに対応できるようになったという。
ChatGPT agentの各種ベンチマークスコアは以下の通りだ。
ChatGPT agentは、ChatGPTの「Pro」「Plus」「Team」プランのユーザーに段階的に提供を開始し、2025年7月中に「Enterprise」「Education」向けにも展開される予定だ。ChatGPTの入力欄の「ツール」から開くメニューで「Agent mode」を押すことで利用できる。
OpenAIは、AIが自律的にアクションを実行することに伴うリスクにも配慮し「安全性をシステムの根幹に据えている」と述べる。機密性の高いアクションの前の明示的なユーザー確認や、重要タスクにおける積極的なユーザー確認、金融取引のようなハイリスクなタスクを積極的に拒否するといった安全対策を導入。プロンプトインジェクション(悪意ある指示による乗っ取り)のような攻撃への防御策も講じているとしている。
アルトマン氏はXで「未来を試すチャンスではありますが、高リスクな用途や個人情報を多く扱う場合には、まだ十分に研究し、実際の現場で改善する機会が得られるまでは使用しない方が良いでしょう」と述べる。まずはエージェントの動きを見守りながら使用してほしい。
トヨタが直面した生成AIの限界 克服目指し業務特化型RAG SaaSを構築
Claudeに店舗運営任せたら暴走して大赤字になった件 素人丸出しでも光る可能性
生成AI、日本企業の“様子見”鮮明に 令和7年「情報通信白書」公開Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。