OpenAIが「Operator」というAIエージェントをChatGPT Proユーザーに向けて提供し始めた。ChatGPTをはじめとする大規模言語モデルは「情報検索や文章生成」を中心に進化してきたが、Operatorはさらに踏み込んで、Webブラウザを使って行う日常業務の代行をAIエージェントで行うという試みだ。
もともと、ネット検索をより深く行って、複数の情報源を照合してレポートを作成するエージェント機能「DeepResearch」というが追加され話題となっていたが、Operatorはクラウド上の仮想コンピュータで動作する専用WebブラウザをAIが操作し、旅行手配やショッピング、請求書作成などの実用的なタスクを自動的にこなすというものだ。
英語環境では学習がかなり進んでいるのか、高い精度でタスクをこなしてくれるようだ。日本語環境では、やや不得意なケースやWebのインタフェース操作を迷うときがある。
しかし、Operatorはそのような場面にユーザーが手動で介入して途中のWeb操作を手助けしたり、クレジットカード情報の入力などを行う仕掛けが盛り込まれている。操作の手助けは学習され、うまく動作してくれないサイトでの今後の動作に役立っていくだろう。
と、ここまで書いても、まだピンとこない読者もいるかもしれない。本記事では、Operatorの技術的背景と特徴、さらに実際に使ってみての可能性など考えてみることにしよう。
AIに定義づけられた製品が花開く――「CES 2025」に見る2025年のテックトレンド
なぜAI全振りを表明したのか パナソニックグループの「CES 2025」ブースを見て分かったこと
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
AIの時代だからこそプライバシー問題を強く意識しよう パーソナルコンピュータ誕生の背景から今に至る歩み
xAIが最新AIモデル「Grok 3」を無料で開放/Xの有料サブスクプラン「Xプレミアムプラス」が大幅値上げCopyright © ITmedia, Inc. All Rights Reserved.