Cloudflare、AIボットからウェブサイトを守る新機能を発表
Cloudflareは、WebサイトをスクレイピングするAIボットをブロックする新機能「AI Scrapers and Crawlers」をすべてのユーザーに提供すると発表した。ダッシュボードで有効にすることで利用できる。
インターネットセキュリティ企業の米Cloudflareは7月3日(現地時間)、AIによるWebサイトのスクレイピング(データの自動収集)を防ぐ新機能を発表した。この機能により、Webサイト運営者は簡単な操作でAIボットからサイトを守ることができるようになるとしている。
近年、米OpenAIの「ChatGPT」などの生成AIの登場により、AIの学習に使用されるデータの需要が急増している。そのため、多くのAI企業がインターネット上の情報を大規模に収集しようとしている。
従来、Webサイト運営者はrobots.txtというファイルを使用して、検索エンジンのクローラーなどのボットにサイトのどの部分にアクセスしてよいかを指示していた。
だが、この方法には限界があるとCloudflareは説明する。例えば、robots.txtは「紳士協定」のようなもので、悪意のあるボットは無視する可能性がある。また、ボットは簡単にユーザーエージェントを偽装できるため、正体を隠すことができる。
Cloudflareの新機能「AI Scrapers and Crawlers」は、グローバルな機械学習モデルを使用して、偽装したボットも検出できるという。顧客はダッシュボード上のトグルスイッチを有効にするだけで利用可能だ。無料プランを含む、すべての顧客が利用できる。
機能を有効にしておくと、新しいAIボットが発見されるごとに自動的にブロックリストに追加される。
Cloudflareは、1秒間に平均5700万件以上のリクエストを処理する巨大なネットワークを持っており、この膨大なデータを活用して、AIボットの行動パターンを学習し、高精度で検出する。例えば、ユーザーエージェントを偽装してブラウザのふりをしているボットでも、その他の特徴から「ボットらしさ」をスコア化し、30点以下のスコアのアクセスを自動的にブロックする。
Cloudflareは、この機能を継続的に改善していく方針。また、不正なAIボットの報告システムも用意し、ユーザーからのフィードバックを積極的に受け付けているとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ソフトバンクと提携のPerplexity、「記事を盗用した」とForbesが非難
AI検索の新興企業で先日ソフトバンクとの提携を発表したPerplexityについて、ForbesとWiredが記事を盗用されたとしている。ForbesはCEOに対し、誤解を招く記事を削除するよう求める書簡を送ったと報じられた。 - アーティストをAI学習から守るSNS「Cara」、ユーザー急増中
アーティストの作品を企業の生成AIトレーニングや盗作に利用されないように守ると謳うSNS「Cara」のユーザーが急増中だ。MetaやXは、ユーザーの投稿をAIのトレーニングに使っていると認めている。 - OpenAI、コンテンツのスクレイピングを遮断するツール「Media Manager」を2025年までに提供へ
OpenAIは、クリエイターが自分のコンテンツが生成AIのトレーニングにどう使われるかを制御できるツール「Media Manager」を開発中と発表した。2025年までに提供する計画だ。 - 読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG
読売新聞社は、Webメディア「読売新聞オンライン」の利用規約を改定すると発表した。掲載記事を生成AIなどに学習させる行為などを新たに禁じる。2月1日から適用する。 - Google、ネット上の公開情報をAIのトレーニングに利用しているとプライバシーポリシーに明記
Googleは7月1日付でプライバシーポリシーを更新し、BardなどのAIのトレーニングにネットで一般公開されている情報を使っていると明記した。