NHKの番組「首都圏ネットワーク」の中に、「STOP詐欺被害!」というコーナーがある。実際に発生したさまざまな詐欺の手口を、物語仕立ての映像で教えてくれるが、正直なところ「なぜこんな単純な手口でだまされるのか」と疑問に感じる回もある。
しかしそれは、冷静な状況で客観的に映像を見られているからだろう。いきなり詐欺電話がかかってきたら、多くの人々が詐欺師のペースに巻き込まれてしまうに違いない。だからこそ、事前に詐欺の手口を、できる限り多く知っておく必要があるといえる。ただ、そうした詐欺の情報を頭に入れておく必要があるのは、もはや人間だけではないようだ。
Web閲覧やWebサービス利用を効率化してくれるテクノロジーとして、進化と普及が期待されている「AIエージェントブラウザ」(Agentic Browser)について、単純な詐欺への脆弱性があるという指摘が注目を集めている。
AIエージェントブラウザとは、簡単に言ってしまえば、いま注目されている「AIエージェント」と一体化したWebブラウザのことを指す。ユーザーが自然言語で指示するだけで、内蔵されたAIエージェントがそれを理解し、ユーザーに代わってWebのブラウジングやWebサービスの操作を行ってくれる。先端テクノロジーの常として、名称も定義もまだ定まっていないのだが、本稿の中ではこの呼び名で統一しておきたい。
どのようなことがAIエージェントブラウザで可能になるのか。代表例の一つである、Webブラウザ「Opera」の「Browser Operator」という機能のデモ動画をご覧いただこう。
動画内ではまず、ユーザー(画面には登場しない)が「男性用サイズ10の白いナイキの靴下を12足探して」と指示する。すると勝手にブラウザが動き(これもユーザーの姿が映るわけではないため、トリックは行われていないと信じることしかできないのだが)、ウォルマートのサイトにアクセスして、指定された商品をカートに入れ、ユーザーが購入の操作を完了させるのを待つ。
次にユーザーは「4月に行われるニューカッスル・ユナイテッドのプレミアリーグホーム戦のチケットを2枚購入して、レギュラーチケットが無ければホスピタリティチケット(プレミアムチケット)でも大丈夫」と指示。するとAIエージェントはニューカッスル・ユナイテッドの公式サイトにアクセスし、4月の試合のチケットを見つけ、1枚240ポンドのチケットを2枚買い物かごに追加、ユーザーの購入完了を待つ。さらに……といった具合だ。
もちろんOperaは以前からあるWebブラウザで、AIエージェントブラウザとして開発されたものではない。AIエージェントを後付けすることで、「ユーザーが自然言語で指示するだけで、AIエージェントがそれを理解し、ユーザーに代わってWebのブラウジングやWebサービスの操作を行う」という状態を達成している。
もう一つのAIエージェントブラウザの代表例であるPerplexityの「Comet」は、最初からAIエージェント内蔵のWebブラウザとして設計されたものだ。これも公式のデモ動画があるので載せておこう。ここではロンドン塔から始まるウオーキングルートの作成や、ドキュメントやRedditの投稿などの要約、メールやカレンダー、ソーシャルメディアなどの連携といったユースケースを紹介している。
また独立したWebブラウザではないが、Webアプリケーションとして提供中のAIが、そのアプリケーション内で仮想ブラウザを立ち上げ、そこでAIエージェントが動くという例もある。この代表例として、ChatGPTで提供されているOperator機能が挙げられる。こちらも公式デモ動画があるので、以下に掲載しておこう。
Copyright © ITmedia, Inc. All Rights Reserved.