10年前のWebページの38%が消失──Pew Research Center調べ
Pew Research Centerは「オンラインコンテンツが消滅するとき」と題する調査レポートを公開した。調査の結果、2013年に存在したWebページの38%が10年後にはアクセスできなくなっていた。
非営利調査機関の米Pew Research Centerは5月17日(現地時間)、「When Online Content Disappears」(オンラインコンテンツが消滅するとき)と題する調査レポートを公開した。「2013年に存在したWebページの38%が10年後にはアクセス不能に」というサブタイトルがついている。
この調査では、非営利プロジェクト「Common Crawl」のリポジトリから2013年から2023年までの毎年の約9万ページ、合わせて約100万のWebページをサンプリングした。調査結果は、この期間の全ページの25%が現在アクセス不能であることを示している。このうち、16%はルートドメインはアクティブだがアクセスできず、残り9%はルートドメインが廃止されたものだ。
政府の公的サイトでは、サンプリングした約50万ページのうち、21%に少なくとも1つのリンク切れが含まれていた。地方自治体レベルのページで特に顕著だった。
ニュースメディアのWebサイトでは、約50万ページの23%に少なくとも1つのリンク切れが含まれていた。サンプルは、comScoreによって「ニュース/情報」として分類された2063ドメインのリストに基づいて収集した。
英語版Wikipediaでサンプリングした5万ページでは、54%に少なくとも1つのリンク切れが含まれていた。
米X(旧Twitter)については、2023年3月8日から4月28日に投稿された約500万件のツイートを追跡した。これらのツイートのうち18%(約5件に1件)は2023年6月15日までに非公開になった。そのうち60%はアカウントの非公開化、停止、削除によるもので、残り50%はアカウントはアクティブだが削除されている。なお、調査が行われた期間はTwitterは既にイーロン・マスク氏による買収は完了しているが、まだサービス名はTwitterで、ポストはツイートと呼ばれていた。
詳しい調査方法についてはレポートを参照されたい。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
キャッシュからダメな情報が見えちゃうよ! 見逃しがちなWebアプリの落とし穴
ネット上で商売するのが当たり前な時代。インシデントが発生すれば失うものは計り知れない。本連載では脆弱性診断実習用のWebアプリ「BadTodo」を題材に、ストーリー形式でWebアプリ制作に潜む“ワナ”について学んでいく。
X(旧Twitter)上の2011年〜2014年のt.coリンクが非表示に バグ?
X(旧Twitter)上の一部の画像が表示されなくなっている。同社独自の短縮URL「t.co」の問題のようだ。
「Web上に記事が残らない」ことは何が問題なのか
Engadget日本版の記事が4月末に全て削除されてしまうことで、Webから記事が消えてしまう問題が大きく取り上げられた。西田宗千佳さんがこのテーマについてまとめた。
すぐに消え、永久に残る ネット情報、矛盾する“2つの顔”
ネットの情報はすぐに消えるし、永久に残る。そんな一見矛盾するネットの2つの顔について考えていきたい。

