Perplexityはブロックされたサイトを「ステルスクローリング」している──Cloudflareが告発
Cloudflareは、AI検索のPerplexityがサイト運営者のブロック設定を回避して「ステルスクローリング」を行っていると告発。robots.txtで拒否しても、クローラー情報を隠してアクセスを試みているという。Cloudflareは対策を強化したと発表した。
米Cloudflareは8月4日(現地時間)、Web検索に特化したAI「Perplexity」を手掛ける米Perplexity AIが、Webクローラーによる特定のWebサイトへのアクセスを阻止するための制限を回避している疑いがあると発表した。PerplexityのクローラーはブロックされるとWebサイトの設定を回避するためにクロールIDを隠ぺいするという。
Cloudflareはネットアーキテクチャプロバイダー大手。顧客から、robots.txtによりPerplexityの公式クローラー(PerplexityBot、Perplexity-User)をブロックしたにもかかわらず、不正アクセスが続いているという苦情を受けたという。
同社がこの問題をテストしたところ、WebサイトでAIスクレイピングを禁止していても、Perplexityはユーザーエージェントを変更し、IPアドレスリストに含まれないIPアドレスを使った。さらに、PerplexityはASN(自律システムネットワーク)を変更することでもブロックを回避しているという。
Cloudflareはこの問題に対処するため、Perplexityのボットを検証済みリストから削除し、こうしたステルスクローリング検出のために、マネージドルールに新たなヒューリスティックを追加し、未登録クローラーを自動ブロックする仕組みを導入したとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Perplexity、AI搭載Webブラウザ「Comet」公開 まずはMaxユーザーに
Cloudflare、AI時代のクリエイター支援策を発表 「コンテンツ独立記念日」宣言
Cloudflareは7月1日に「コンテンツ独立記念日」を宣言し、AI時代におけるクリエイターの権利保護と収益化を支援する新構想を発表した。AIクローラーをデフォルトでブロックし、コンテンツ利用に応じて課金する「pay per crawl」の導入などを目指す。
“Google対抗”のAI検索「Perplexity」が模索する、出版社との共存共栄
AIの無断学習は絶対許さない──Webクローラーを“出口のない落とし穴”に閉じ込めるプログラム、海外ユーザーが公開
Webを巡回してAIモデルの学習に使う情報をかき集めるクローラーの横行に対し、反発が強まっている。ある海外ユーザーが迷惑クローラーを“出口のない落とし穴”に閉じ込めて撃退するプログラム「Nepenthes」を公開した。

