ホテル予約、買い物──AIがWebサイトを人間のように操作する「Operator」は、AGI(汎用人工知能)への大きなステップだ 実際に試してみた本田雅一のクロスオーバーデジタル(4/4 ページ)

» 2025年02月27日 15時00分 公開
[本田雅一ITmedia]
前のページへ 1|2|3|4       

発展途上だが“可能性”を知らしめる存在に

 汎用性と柔軟性は大きな魅力だが、現時点ではミスも少なくない。

 OpenAI自身も誤動作や操作ミスのリスクを認めている。現時点では内部テストでも成功率が満足できるほど高くはなく、操作エラーや意図しない挙動が起こりうるとしている。あくまでもテスト段階ということだ。

 また、ユーザーの介入も不可欠だ。CAPTCHAやログイン認証など、人間による対応が必要な局面では処理が止まってしまう。また最終決定時に必ずユーザー承認を求める設計のため、「完全放任で自動化」というわけではない。

 AIエージェントが自由にWebブラウザを操作できるようになることで、悪用のリスクやプロンプトインジェクションへの脆弱(ぜいじゃく)性も懸念されるところだろう。Operatorが意図せず不正なサイトの指示に従う可能性もある。

 OpenAIの開発者は多層的な安全策を施しているというが、懸念を払拭しきるには時間がかかるだろう。

 また、現時点では月額3万円のChatGPT Proプラン限定で、一般ユーザーは利用できない。将来的に安価なプランに提供範囲が拡大する可能性はあるが、まだ研究プレビュー段階でユーザーベースが限られている。

 Webブラウザ外のローカルアプリ操作には非対応で動作速度やレスポンスも現時点では満足できるとはいえない。しかし、Operatorは“答えるAI”から“動くAI”へ進化させる第一歩になり得る。それは、汎用(はんよう)的なAIエージェントへの大きなステップだ。

 今後はさらに強化学習のフィードバックを重ね、成功率を上げ、より広範なWebサイトや多様なGUI要素にも対応できるようアップグレードを重ねていくとみられる。

 なお、将来的にはChatGPT Plusや企業向けTeamプランでも利用可能になるとしている。今後は各社が同様のAIエージェント技術を繰り出し、より広い業界で実務的な利用が進むだろう。旅行やショッピングといった個人向けのシナリオだけでなく、社内業務の代行や顧客サービスの向上にも応用が期待される。

 この取り組みが、既存WebサービスとAIが連携する価値を可視化することで、直接AIと対話するAPIを使うサービスが増加することも期待できる。それはAGI(汎用人工知能)には必要なことだ。

 つまりこの取り組みがAGIに向けての大きな一歩となるかもしれない。現時点では研究プレビューの範囲だが、”AIと人間世界とのインタラクション”を夢想する絶好の機会といえる。

前のページへ 1|2|3|4       

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー