検索
連載

ChatGPTが“操縦”するWebブラウザの使い心地は? OpenAI「Atlas」レビュー 革新の裏にはリスクも小寺信良のIT大作戦(2/3 ページ)

米国時間の10月21日に、米OpenAIからAI統合型ブラウザ「ChatGPT Atlas」が発表されると、SNSではすぐにその動作の様子が投稿され、ネットには解説サイトが立ち上がるなど話題だ。ただその一方で、それほど単純な話ではないという意見も聞こえてくる。AI統合型ブラウザがもたらすものと、そのリスクは何か。ChatGPT Atlasにまつわる諸問題を検討してみたい。

Share
Tweet
LINE
Hatena

 3つ目のモードは、「エージェントモード」だ。これはユーザーが明示的に切り替えを行わない限り、自動的には切り替わらない。このモードでは、ユーザーの指示に応じてAIが動作を代行する。例えばページを行き来して全体を把握したり、フォームに必要事項を入力したりといった作業を自律的に行うモードである。

 SNSで公開されている自動動作の様子は、このエージェントモードによるものだ。なお現在エージェントモードが使えるのは、Enterpriseを除く有料プラン利用者のみである。つまりエージェントモードの動作を投稿しているユーザーは、ChatGPTの課金ユーザーであるということだ。


ユーザーが選択したときのみ実行されるエージェントモード

 Webブラウザとしては、Chromiumベースとなっている。Chromiumベースのブラウザは世の中には数多くあるが、多くは独自機能を備えており、Chromeとは違った方向性で拡張されたものが多い。

 一方ChatGPT Atlasのブラウザとしての出来は非常にシンプルというか、プリミティブなものとなっている。ブックマークはインポートできるが、ただひたすら横にずらずらとスクロールするだけで、画面の端から縦方向に探せるといった機能はない。

 またChrome互換として拡張機能も使えるはずだが、現在はまだ動作していない。日本語翻訳など拡張機能を便利に使っている人も多いと思うが、現時点ではそれらの機能はAIに直接お願いしてゴリゴリ動かすみたいなことになる。

 一方で一般のブラウザにはない機能が、ブラウザメモリ機能だ。これは過去に参照したWebページへの閲覧状況を学習することで、より良い回答を提供することを目指した機能である。また過去のチャット履歴も記憶されており、「以前調べたアレをアレして」みたいなリクエストも実行できる。


ユーザーの行動履歴を記憶するブラウザメモリ機能

 過去のチャット履歴は、デスクトップ版ChatGPT同様、左側のサイドパネルからアクセスできる。これらのメモリ機能は、ユーザーが自分で削除もできる。こうしたChatGPTのパーソナライズ機能は、デスクトップ版の設定と連動するようだ。これまでデスクトップアプリを使っていた人は、同じ設定がそのまま適用される。

エージェントモードの動作

 エージェントモードでは、ユーザーの指示によってWebサイトを自動的に操作することができる。ここでは例として、「Amazonで1TBのM.2 NVMe SSDで2280サイズのTLCタイプのものを探して、評価が3以上のもので一番安いものをショッピングカートに入れてください」という指示を出した。

 エージェントモードには、ログインモードとログアウトモードの2つがある。ログインモードは、ユーザーが各種サービスへログインしている状態を保持して動作できる。ログアウトモードは、全てのサイトからログアウト状態で動作する。


エージェントモードには2つの動作状態がある

 今回はログインモードで動作させているが、ChatGPT AtlasでAmazonへアクセスするのは初めてだったので、途中ログイン画面になってそこでポーズ状態になり、ユーザーの動作待ちへと切り替わった。筆者が自分でログインしたのち、動作を再開させた。これ以降は自動で動くはずだ。一方ログアウトモードでは、毎回今回のようなログイン動作が必要になるはずである。


ログイン動作などが必要な場合は、その都度停止してユーザーの入力を待つ

 途中でEnterキーが入力できないので検索クエリが働かないとか、クリックが効かないとかいくつかの困難があったようだが、AIが自分で考えて別の解決策を探し、最終的には無事商品がカートへ入った。おそらく人間がやったら20〜30分ぐらいはあれこれ悩むところだが、実働時間は2分程度であった。


およそ2分で操作が完了し、カートに商品が入れられた

 なおエージェントモードでは、決済に関わるような機密性の高いところでは自動的に停止(ポーズ)して、ユーザーの入力待ちとなる。「なんか知らんが炭酸水が1ケース届いた」みたいなことにはならないはずだ。その他、安全装置として、コードの実行やファイルのダウンロード、拡張機能のインストールといった動作は制限されている。ただし拡張機能に関しては、エージェントモードと連動して導入できる計画があると、ChatGPT自体が回答している。


将来的にはエージェントモードと連動した形で拡張モジュールが導入できるようにするという回答

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る