汎用性と柔軟性は大きな魅力だが、現時点ではミスも少なくない。
OpenAI自身も誤動作や操作ミスのリスクを認めている。現時点では内部テストでも成功率が満足できるほど高くはなく、操作エラーや意図しない挙動が起こりうるとしている。あくまでもテスト段階ということだ。
また、ユーザーの介入も不可欠だ。CAPTCHAやログイン認証など、人間による対応が必要な局面では処理が止まってしまう。また最終決定時に必ずユーザー承認を求める設計のため、「完全放任で自動化」というわけではない。
AIエージェントが自由にWebブラウザを操作できるようになることで、悪用のリスクやプロンプトインジェクションへの脆弱(ぜいじゃく)性も懸念されるところだろう。Operatorが意図せず不正なサイトの指示に従う可能性もある。
OpenAIの開発者は多層的な安全策を施しているというが、懸念を払拭しきるには時間がかかるだろう。
また、現時点では月額3万円のChatGPT Proプラン限定で、一般ユーザーは利用できない。将来的に安価なプランに提供範囲が拡大する可能性はあるが、まだ研究プレビュー段階でユーザーベースが限られている。
Webブラウザ外のローカルアプリ操作には非対応で動作速度やレスポンスも現時点では満足できるとはいえない。しかし、Operatorは“答えるAI”から“動くAI”へ進化させる第一歩になり得る。それは、汎用(はんよう)的なAIエージェントへの大きなステップだ。
今後はさらに強化学習のフィードバックを重ね、成功率を上げ、より広範なWebサイトや多様なGUI要素にも対応できるようアップグレードを重ねていくとみられる。
なお、将来的にはChatGPT Plusや企業向けTeamプランでも利用可能になるとしている。今後は各社が同様のAIエージェント技術を繰り出し、より広い業界で実務的な利用が進むだろう。旅行やショッピングといった個人向けのシナリオだけでなく、社内業務の代行や顧客サービスの向上にも応用が期待される。
この取り組みが、既存WebサービスとAIが連携する価値を可視化することで、直接AIと対話するAPIを使うサービスが増加することも期待できる。それはAGI(汎用人工知能)には必要なことだ。
つまりこの取り組みがAGIに向けての大きな一歩となるかもしれない。現時点では研究プレビューの範囲だが、”AIと人間世界とのインタラクション”を夢想する絶好の機会といえる。
AIに定義づけられた製品が花開く――「CES 2025」に見る2025年のテックトレンド
なぜAI全振りを表明したのか パナソニックグループの「CES 2025」ブースを見て分かったこと
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
AIの時代だからこそプライバシー問題を強く意識しよう パーソナルコンピュータ誕生の背景から今に至る歩み
xAIが最新AIモデル「Grok 3」を無料で開放/Xの有料サブスクプラン「Xプレミアムプラス」が大幅値上げCopyright © ITmedia, Inc. All Rights Reserved.