OpenAIのクローラーをNew York Timesなどのペイウォールメディアがブロック開始
The New York Timesや日経新聞など、ペイウォールを設置する複数のメディアが、生成AIのトレーニング用にコンテンツを収集するクローラーをブロックし始めている。
米The New York Timesや日経新聞など、記事を読むためにサブスクリプションが必要な、ペイウォールを設置しているメディアサイトが、米OpenAIのWebクローラー「GPTBot」をブロックし始めている。米The Vergeが8月22日(現地時間)、The New York Timesのブロックについて報じた。
GPTBotは、OpenAIのAIチャットbot「ChatGPT」などのAIモデルのトレーニングのためのデータを収集するクローラー。
OpenAIは公式サイトで、ペイウォールを設定しているページや個人を特定できる情報を収集するページをフィルタリングしていると説明しているが、同じページでサイトへのアクセスを禁止する方法も説明している。
The Vergeによると、The New York Timesのrobots.txtにGPTBotをブロックする行が追加されたのは17日前後という。
The New York Timesは3日付で利用規約を更新し、サービスの使用禁止の条項に「機械学習またはAIシステムのトレーニングを含むがこれらに限定されない、ソフトウェアプログラムの開発にコンテンツを使用すること」という文言を追加した。
本稿筆者が調べた範囲では、米CNN、米Bloomberg、米Reuters、米Business Insider、日経新聞などのペイウォールのあるメディアがGPTBotをブロックしている。米Washington Postと米Buzz Feedはペイウォールがあるが、今のところブロックしていない。
また、米Amazon.comもGPTBotをブロックしている。
OpenAIは7月、ペイウォールのあるメディアの有料記事が読めてしまうという報告を受け、ChatGPT PlusのWebブラウジングを一時停止した(現在も停止中)。
関連記事
- 「生成AIは著作権保護の検討が不十分」新聞協会など声明 「著作権法30条の4は大きな課題」
新聞協会など4団体は、生成AIにまつわる著作権保護策の再検討を求める共同声明を発表した。日本の著作権法第30条の4が「諸外国に比べ、AI学習に極めて有利に作られていることは大きな課題」と指摘している。 - Google、報道機関向けAI提供を検討中 New York Timesは不安示す
米New York Timesは、米Googleが報道機関に執筆支援AIを売り込んでいると報じた。記事ではAI活用に対する不安や懸念も述べているが、Googleは「ジャーナリストの役割を果たすものではない」としている。 - 全米作家協会、生成AI大手に「トレーニングに著作を無断で使うな」公開書簡
OpenAIやGoogle、Metaなど、生成AIを手掛ける米大手のCEO宛に、全米作家協会が著作物をAIのトレーニングに無断で使わないよう求める書簡を公開した。既に8500人以上が署名している。 - ChatGPT PlusのWebブラウジングが一時停止に 有料記事を読めてしまうとの報告を受け
OpenAIは、ChatGPT Plusでβ版として提供している「Browse with Bing」を無効にした。ペイウォールで制限されている記事を表示してしまう問題を修正するまでの一時的な停止だ。これにより、GPT-4の情報は2021年9月までのものに戻ってしまった。 - ChatGPTは「ハリー・ポッター」を読破済み? 生成AIで懸念される著作権侵害のリスクとは
日本企業でも、チャットAI「ChatGPT」の活用や導入検討が始まりつつある。一方、生成AIの出力結果によっては、第三者の著作権を侵害してしまうリスクも付きまわる。中でも懸念されるのは「学習した著作物に近い形で、コンテンツを生成する」というものだ。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.