いざ調べ始めると大変、ネットにない古い情報を探すには:小寺信良のIT大作戦(2/2 ページ)
米Pew Research Centerの調査によれば、2023年10月の時点で10年前のWebページの38%がアクセス不能であるという。Webページが失われていくということは、当時のトレンドが分からなくなるということにもなりかねない。情報が書籍などの紙媒体になっていれば安心とも限らない。紙から情報を探すのは大変だ。
図書館にあれば安心なのか?
書籍や文献など図書として出版されたものは、納本制度により全て国立国会図書館に収蔵される事になっている。また電子書籍や電子雑誌も、平成25年から収集・保存が始まっている。よって知識が失われることはないと思う方も多いと思うが、実際にこれを利用する立場になったことがあるだろうか。
国立国会図書館では、実際にそこへ行って収蔵されている資料を閲覧できるだけでなく、ネットを通じて資料のコピーを請求できる。
だが逆に言えば、探している情報がどの書籍の何ページに掲載されているのかが分からなければ、そもそも請求もできない事になる。収蔵の資料はNDL SERCHというページから探せるが、実際にやってみると、まあ見つからない。
例えばジェット・ダイスケ氏が広く普及させたといわれている動画編集手法「ジェットカット」について調べようと思っても、ジェットカッターに言及した論文などが見つかるだけである。ジェットカットについては、筆者が記した書籍「仕事ですぐに使える!DaVinci Resolveによる動画編集」という書籍で言及しており、この書籍も国立国会図書館に収蔵されているが、本文検索ができないので、結果的に見つからないのである。
存在するのに、リーチする手段がない。これは、10年前のWebサイト38%が見つからない問題と、本質的には変わらないように見える。Webサイトの場合は、削除されたものもある一方、そのほとんどがリンク切れのためにリーチできないのだ。
国立国会図書館でも収蔵されている紙資料のデジタル化とOCRは粛々と進めているが、古い順や重要度といった重みづけ順で行われているため、われわれが知りたい資料がそれに当たっているかどうかは、調べてみないと分からない。
インターネット上に蓄積された集合知があまりにも膨大なため、われわれはググれば何でも分かると思い込んでしまったが、あったはずの情報がもう見つからない、でも紙の資料ならあるはず、ということに直面する可能性が出てきている。
紙の資料を探すには、図書館に行く、電話する、対面で話を聞くといった手段を駆使して、少しずつ接近していくしかない。「ネット外」の資料をどう系統化し、リーチできるようにするのか。それは、「ネットに載せればよい」という方法では解決できない。
ネットでは今後、AIを駆使した効率的な検索が実現するだろうが、ネットにはない情報を探すには、自分1人の力ではどうにもならない時がある。こうした紙の情報を探す手法に対する理解や敬意は、忘れてはならない部分である。同時に自分がなんらかの紙の資料を握っているならば、誰かの調べものを助ける立場になったときの寛容性もまた、備えておかなければならないだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
10年前のWebページの38%が消失──Pew Research Center調べ
Pew Research Centerは「オンラインコンテンツが消滅するとき」と題する調査レポートを公開した。調査の結果、2013年に存在したWebページの38%が10年後にはアクセスできなくなっていた。
「Web上に記事が残らない」ことは何が問題なのか
Engadget日本版の記事が4月末に全て削除されてしまうことで、Webから記事が消えてしまう問題が大きく取り上げられた。西田宗千佳さんがこのテーマについてまとめた。
すぐに消え、永久に残る ネット情報、矛盾する“2つの顔”
ネットの情報はすぐに消えるし、永久に残る。そんな一見矛盾するネットの2つの顔について考えていきたい。
X(旧Twitter)上の2011年〜2014年のt.coリンクが非表示に バグ?
X(旧Twitter)上の一部の画像が表示されなくなっている。同社独自の短縮URL「t.co」の問題のようだ。
キャッシュからダメな情報が見えちゃうよ! 見逃しがちなWebアプリの落とし穴
ネット上で商売するのが当たり前な時代。インシデントが発生すれば失うものは計り知れない。本連載では脆弱性診断実習用のWebアプリ「BadTodo」を題材に、ストーリー形式でWebアプリ制作に潜む“ワナ”について学んでいく。

