生成AIに学習させるためのボットが、大規模なWebアクセスを生んでいる。中でも、AIがユーザーの質問に応じ、リアルタイムでWebサイトから情報を取得するプログラム「フェッチャーボット」によるリアルタイムリクエストは、毎分3万9000を超えることもある――大手CDN「Fastly」運営元の日本法人・ファストリーが9月17日、こんな分析結果を発表した。
同社の調査によると、フェッチャーボットリクエストの98%はOpenAI製ボットが占めている。この規模のトラフィックは帯域幅やサーバーを圧迫し、「悪意がなくてもDDoS攻撃と同様の影響を与える事態」だと指摘している。
一方、Webサイトを自動巡回してAIモデルの学習データを収集する「AIクローラー」のトラフィックは52%をMetaが占め、Googleの23%、OpenAIの20%の合計を上回った。
地域別では、北米のAIクローラートラフィックが全体の約9割を占めた。欧州やアジアなど他地域の割合は極めて小さく、AIモデルの学習データにおける地理的偏りが拡大しているため、AI出力の中立性に問題が出る可能性がある。
業界別では、コマース、メディア・エンターテインメント、ハイテク業界がAIモデル訓練のためのスクレイピング対象になっているという。
調査は、同社のWebアプリ用ファイアウォール「Fastly Next-Gen WAF」と、Webサイトなどをボットから保護するサービス「Fastly Bot Management」から得られる月間6.5兆のリクエストに基づいて実施した。
ネットトラフィックの37%がボット、うち9割が悪意あるもの――Fastly調査
朝日と日経、米Perplexityを共同提訴 読売に続き 「記事の無断利用」で計44億円請求
AI事業者は「権利者の意思表示」尊重すべき――日本新聞協会、生成AIの“無断学習”巡り声明Copyright © ITmedia, Inc. All Rights Reserved.