ホテル予約、買い物──AIがWebサイトを人間のように操作する「Operator」は、AGI(汎用人工知能)への大きなステップだ 実際に試してみた:本田雅一のクロスオーバーデジタル(4/4 ページ)
本記事では、Operatorの技術的背景と特徴、さらに実際に使ってみての可能性など考えてみることにしよう。
発展途上だが“可能性”を知らしめる存在に
汎用性と柔軟性は大きな魅力だが、現時点ではミスも少なくない。
OpenAI自身も誤動作や操作ミスのリスクを認めている。現時点では内部テストでも成功率が満足できるほど高くはなく、操作エラーや意図しない挙動が起こりうるとしている。あくまでもテスト段階ということだ。
また、ユーザーの介入も不可欠だ。CAPTCHAやログイン認証など、人間による対応が必要な局面では処理が止まってしまう。また最終決定時に必ずユーザー承認を求める設計のため、「完全放任で自動化」というわけではない。
AIエージェントが自由にWebブラウザを操作できるようになることで、悪用のリスクやプロンプトインジェクションへの脆弱(ぜいじゃく)性も懸念されるところだろう。Operatorが意図せず不正なサイトの指示に従う可能性もある。
OpenAIの開発者は多層的な安全策を施しているというが、懸念を払拭しきるには時間がかかるだろう。
また、現時点では月額3万円のChatGPT Proプラン限定で、一般ユーザーは利用できない。将来的に安価なプランに提供範囲が拡大する可能性はあるが、まだ研究プレビュー段階でユーザーベースが限られている。
Webブラウザ外のローカルアプリ操作には非対応で動作速度やレスポンスも現時点では満足できるとはいえない。しかし、Operatorは“答えるAI”から“動くAI”へ進化させる第一歩になり得る。それは、汎用(はんよう)的なAIエージェントへの大きなステップだ。
今後はさらに強化学習のフィードバックを重ね、成功率を上げ、より広範なWebサイトや多様なGUI要素にも対応できるようアップグレードを重ねていくとみられる。
なお、将来的にはChatGPT Plusや企業向けTeamプランでも利用可能になるとしている。今後は各社が同様のAIエージェント技術を繰り出し、より広い業界で実務的な利用が進むだろう。旅行やショッピングといった個人向けのシナリオだけでなく、社内業務の代行や顧客サービスの向上にも応用が期待される。
この取り組みが、既存WebサービスとAIが連携する価値を可視化することで、直接AIと対話するAPIを使うサービスが増加することも期待できる。それはAGI(汎用人工知能)には必要なことだ。
つまりこの取り組みがAGIに向けての大きな一歩となるかもしれない。現時点では研究プレビューの範囲だが、”AIと人間世界とのインタラクション”を夢想する絶好の機会といえる。
関連記事
AIに定義づけられた製品が花開く――「CES 2025」に見る2025年のテックトレンド
CES 2025では、前年の「Software Defined」の流れを引き継いで「AI Defined」という潮流が生まれていることを予感させる基調講演が多かった。この潮流は、世の中の製品にどのような影響を与えるのだろうか。なぜAI全振りを表明したのか パナソニックグループの「CES 2025」ブースを見て分かったこと
パナソニックグループの楠見グループCEOが、「CES 2025」でキーノートスピーチを行い、展示ブースを展開している。その内容をチェックした。GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
NVIDIAのジェンスン・ファンCEOが「CES 2025」の基調講演に登壇した。新アーキテクチャのGPU「GeForce RTX 50シリーズ」に注目が集まりがちだが、注目すべきポイントはそこだけではない。AIの時代だからこそプライバシー問題を強く意識しよう パーソナルコンピュータ誕生の背景から今に至る歩み
毎年1月28日は「データ・プライバシーの日」となっている。林信行氏が、PCの生い立ちから現在までに至る道のりを考察した。xAIが最新AIモデル「Grok 3」を無料で開放/Xの有料サブスクプラン「Xプレミアムプラス」が大幅値上げ
うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、2月16日週を中心に公開された主なニュースを一気にチェックしましょう!
Copyright © ITmedia, Inc. All Rights Reserved.