ChatGPTが“操縦”するWebブラウザの使い心地は? OpenAI「Atlas」レビュー 革新の裏にはリスクも:小寺信良のIT大作戦(1/3 ページ)
米国時間の10月21日に、米OpenAIからAI統合型ブラウザ「ChatGPT Atlas」が発表されると、SNSではすぐにその動作の様子が投稿され、ネットには解説サイトが立ち上がるなど話題だ。ただその一方で、それほど単純な話ではないという意見も聞こえてくる。AI統合型ブラウザがもたらすものと、そのリスクは何か。ChatGPT Atlasにまつわる諸問題を検討してみたい。
米国時間の10月21日に、米OpenAIからAI統合型ブラウザ「ChatGPT Atlas」が発表されると、SNSではすぐにその動作の様子が投稿され、ネットには解説サイトが立ち上がった。
AIとブラウザの融合は、以前からChromeとGemini、EdgeとCopilot、OperaとAriaといった組み合わせのほか、10月2日には米Perplexityから「Comet」が登場していた。だがChatGPT Atlasの受け入れられ方というかその熱量は、それらとは一線を画したものになっている。
AIとブラウザが融合すると、何ができるようになるのか。これまでAIで調べ物をすると、その概要をまとめてテキストで表示し、関連するサイトなどはリンクで示されていた。そのリンクをクリックするとブラウザで表示されるが、そこから先はAIから切り離されることになる。
しかしAI統合型ブラウザの場合、調べ物をするところまでの挙動は同じだが、その中のリンクをクリックすると同じブラウザ内でWebサイトが表示され、AIが脇に控えている格好になる。つまり、Webサイトに対してAIが常に参照できるようになるわけだ。
そのままAIにこのページをサマってとか翻訳してとか、必要なデータを取り出してスプレッドシートに貼って、といった指示ができる。インターネット上には情報だけでなく多くのインタラクティブサービスが展開しており、従来は人間がログインして操作することで一定の作業を行ってきたわけだが、AIにその作業を代行させることもできる。
人間が欲しいのは、作業プロセスではなく、あくまでも結果だ。だが作業プロセスが複雑であったり、あるいは単純な繰り返しが続くようなものであったりする場合、結果が得られるまでに労力がかかっていた。むしろそうした労力の方が仕事の中心のように感じられることも少なくなかったが、結果がスピーディーに得られれば、それだけ考える時間も増える。より人間が行うべきことが明確化し、深まることが期待できる。
ただその一方で、それほど単純な話ではないという意見も聞こえてくる。AI統合型ブラウザがもたらすものと、そのリスクは何か。ChatGPT Atlasにまつわる諸問題を検討してみたい。
ChatGPT Atlasの構造
ChatGPT製品部門の責任者であるニック・タリーは、10月6日の年次開発者会議で、「わたちはもともとチャットボットをつくるつもりはありませんでした。そもそもは“スーパーアシスタント”をつくろうとしていたのですが、少し寄り道してしまったのです」と述べている。
この会議では、ChatGPTがOS化するという発表も行っているが、ChatGPT Atlasも大きな方向性としては、この“スーパーアシスタント”構想に沿うものだと考えられる。
これまでAIは、人間の質問に受け答えするチャット型か、画像生成型が広く注目を集めてきた。一方、人間の指示によって自律的に動作するAIエージェント(スーパーアシスタント)型は、Visual Studio CodeやCursorといった一部の開発ツールに搭載されてきた。それがChatGPT Atlasの登場により、プログラマー以外にも恩恵が得られる形で登場したということになる。
ChatGPT Atlasは、一見するとWeb上で利用できるChatGPTと同じように見えるが、実際には3つのモードがある。新規タブを開いて最初に現れるのが、「ブラウジングモード」だ。ここで調べたい事柄を入力すると、AIによる回答とともに、検索によって得られたページが表示される。検索によって得られたページは、一番上のアイコン、「検索する」「画像」「動画」「ニュース」のタブによって分類されている。基本的にはこのモードが標準状態である。
ブラウジングモードと並行して存在しているのが、「通常チャットモード」だ。これはWebページの検索を伴わず、会話のみを行うモードである。ブラウジングモードと通常チャットモードは明確な区切りはなく、質問内容によって自動的に切り替わる。
Copyright © ITmedia, Inc. All Rights Reserved.




