OpenAI、Webでのタスクを代行するエージェント「Operator」発表
米OpenAIは1月23日(現地時間)、「独自のWebブラウザを使用してタスクを実行できるエージェント」である「Operator」を発表した。リサーチプレビュー版を、まずは米国のPro(月額200ドル)加入者に提供開始した。
この「独自のブラウザ」は、OpenAIが開発した「Computer-Using Agent(CUA)」モデルに基づいており、GPT-4oの視覚能力と強化学習による高度な推論を組み合わせている。これにより、OperatorはWebページ上のボタンやメニュー、テキストフィールドなどのGUI要素と直接対話し、ユーザーに代わってタスクを実行することが可能だ。
例えばオンラインショップでの買い物やレストランの予約、旅行の計画と予約、経費精算サイトでの処理などを、ユーザーが希望や条件を入力すると代行する。
OpenAIが動画で紹介した例の1つはピザの宅配注文。「<店名>のミディアムサイズのピザを10枚注文して。バーベキューピザも追加ね。レストランが閉まっている場合は、できるだけ早い時間に予約して」という口語調のプロンプトを入力すると……。
DoorDashにアクセスしてリクエストに対応しようとする。
選択肢が複数ある場合はユーザーに確認を求めるようだが、このデモではどの程度自動化されているのかはよく分からない。
別のレストラン予約のデモでは、OpenTableでの予約の前にプロンプトの追加を求められていた。
ログイン認証情報などの機密情報の入力が必要な場合は、ユーザーに入力を要求してくる。
立ち上げ段階では、DoorDashやOpenTableなど、以下のネットサービスで利用可能になっている。
OpenAIはまた、Operatorは「有害なリクエストを拒否し、許可されていないコンテンツをブロックする」ように設計されていると説明した。
将来的には、公共部門のアプリでも利用できるようにしたいとしている。
OpenAIは将来的に、OperatorをPlus、Team、Enterpriseユーザーに提供し、「これらの機能をChatGPTに統合する」計画だとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「今日言うつもりはなかったが……」 孫正義氏が明かした「ロボット自動量産工場」の実態
-
2
【役に立つの?】「Google公式」の初心者向けAI講座、受けてみたら想像以上にすごかった
-
3
「最初は壊れ過ぎてビビった」──1220億円投じたソフトバンク「AIスパコン」、それでもNVIDIAのGPUを選ぶワケ
-
4
陸自駐屯地で四足歩行型の警備用ロボットが見回り GMOインターネットグループが開発
-
5
【解説】キオクシアなぜ急成長? 半導体メモリって何? AIブームを見通すための基礎知識
-
6
日立、メインフレーム事業から撤退へ ハード製造終了から9年後の決断
-
7
OpenAI、「GPT-5.5 Instant」をアップデート 会話の文脈維持や箇条書き減など「読みやすさ」を改善
-
8
ClaudeをSlackチャンネルに召喚、“チームの一員”として直接指示 新機能「Claude Tag」登場
-
9
AmazonはNVIDIAに挑戦状を突きつけるのか
-
10
“中国ヒューマノイド革命”はなぜ起きた、異業種や大手テックが動かす市場の今
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR