ニュース
» 2009年12月07日 19時01分 UPDATE

ウェブ学会シンポジウム:長尾館長が語る、Google検索の限界とその先

「Googleが圧倒的に便利という時代ではなくなってきている」――国会図書館の長尾真館長は、次世代検索の必要性や図書館での取り組みなどについて話した。

[岡田有花,ITmedia]
画像 長尾館長

 「Googleが圧倒的に便利という時代ではなくなってきている」――情報工学者としても知られる国立国会図書館の長尾真館長は、12月7日の「ウェブ学会シンポジウム」(東京大学)でこう述べ、次世代検索の必要性や、国会図書館が取り組んでいるWebサイトのアーカイブ化の取り組みについて説明した。

 長尾館長は、Googleのキーワード検索ではヒットする情報量が多すぎる上、信頼性も担保されていないと指摘する。

 「検索上位の情報が必ずしも信頼できるとは限らない。欲しい情報がヒットしなかったとき、本当に情報がないのか調べる必要もあるし、全く逆の情報がネット上にあり、その情報の方が信頼できるかもしれない。対立する情報を合わせて提示するようシステムも考える必要がある」

 今後は、精度の高い自然文検索など求めている情報とうまくマッチングする技術や、信頼性を確保するシステムなどが必要になってくるとし、その例として、独立行政法人情報通信研究機構(NICT)が開発している情報の信頼性を解析するシステム「WISDOM」や、京都大学が研究している自然文検索システムを挙げた。

 Web上では膨大な情報が日々増え続けているため、Googleのようなクローリングとロボット検索では限界が来ると指摘する。「Googleが10年後もいまと同じ集め方でサイト情報を集めてるか疑問。どういう情報を“集めない”かという判断することになるだろう」

ネット時代、図書館が拠って立つのは「信頼性」

 「ネット上では、貴重な情報も短期間に消えてなくなる。国会図書館としても残さなくては」――国会図書館では2002年からWebサイトを収集するアーカイブ事業「WARP」(Web ARchiving Project)も行っている。これまで国や公共機関のサイトなど公共性の高い2500サイトを定期的に保存してきたという。

 従来はサイトごとに許諾を得る必要があったが、2009年6月の著作権法改正で、国や地方公共団体などのサイトに限り、許諾なしに収集できるようになった。現在は収集データに人手でダブリンコア(メタデータの共通語彙)に沿ったメタデータを付けており、自動化を研究中だ。

 ネット上の電子書籍を国会図書館に納本してもらう「電子納本」も検討している。ただ「電子出版物とは何かという定義が必要という困難」など問題があり、実現にはまだ遠そうだ。

 検索でさまざまな情報が得られる今、図書館の存在意義が改めて問われている。「ネット上の情報はある意味電子図書館だが、残念ながら信頼性が欠けている。図書館が拠って立つ最後のとりでは信頼性」と長尾館長は話す。

 ネット上にも現実社会のように、ルールや法律が必要だという考えも示した。「今は、リンクをクリックすることすら危険なこともある。規制はよくないともいう意見もあるが、誰もが安心してネットを活用するためには、法律のようなものが必要になっていくのではないか」

関連キーワード

国会図書館 | シンポジウム


Copyright© 2016 ITmedia, Inc. All Rights Reserved.

Loading

ピックアップコンテンツ

- PR -

マーケット解説

- PR -