「見えなかった情報」を可視化――NII、論文300万件をGoogle検索対象に
国内論文約300万件が、Googleから検索できるようになった。Web検索だけで情報収集を完結してしまう人にとって検索にひっかからない情報は存在しなかったも同然。検索対象に加えることで、論文をWeb上でも“可視化”する。
国立情報学研究所(NII)が4月から、国内の学術論文情報300万件のデータベース「CiNii」(サイニイ)をGoogle検索対象にした。同時に、データベースも検索エンジンが見つけやすい形に変更。一般ユーザーが論文情報にアクセスしやすくした(関連記事参照)。
論文検索エンジン「Google Scholar」のコンテンツを整備・充実させたいGoogleの思惑と、論文情報へのアクセスを増やしたいNIIの思惑が一致して実現した。「Googleにすべてを持っていかれるのでは」――CiNiiに論文を提供している学会の一部にはこう心配する声もあったというが、NIIが説得を重ね、構想から約1年後に公開にこぎつけた。
「『今すぐ無料で情報が欲しい』というWebを中心にした生活スタイルと、書籍や論文という“知識の体系”とのすき間を埋めてきたい」と、NII助教の大向一輝氏は狙いを語る。
「なかったこと」になっていた情報を可視化
何かを調べる際、Web上だけで情報収集を済ませてしまう人は今や少なくない。そういう人にとっては、論文にちょうどいい情報があったとしても、Web検索に引っかからない限りその情報は「なかったこと」になってしまう。
NIIは、論文を検索しようと考えもしなかった人に、まずは論文の存在を知ってもらいたい、と公開に踏み切った。「普通の人がものを探す中で、いきなりCiNIIに来ることはないだろうが、Google検索でこのページにたどりつくことはあるだろう」と、NIIコンテンツチーム係長の阿蘇品(あそしな)治夫さんは語る。
CiNiiに収録されているのは、全国271の学会・協会から提供を受けた論文と、大学の研究紀要に収録された論文計約300万件。加えて一部雑誌の情報も検索できる。ある論文が別の論文からどれぐらい引用されたかを参照できる「被引用数」データも収録している。
今回、GoogleとGoogle Scholarで検索できるようになったのは、従来のCiNiiでも無料で検索できた著者名や論文名、被引用数データなど、論文の冒頭に付けている概要紹介(アブストラクト)だ。“Googleフレンドリー”にするため、HTMLやURLをGoogleが検索しやすいよう書き換えたり、パーマネントリンクのURLをページ上に掲載したりするなどといった地道な作業も行った。
論文本文PDFの閲覧は従来通り、一部を除いて有料だ。「論文データベースを作るのは手作業で、膨大な手間ひまがかかっている。論文の形式や料金体系も学会によってさまざま。一括して無料にはできない」と大向氏は事情を説明する。
学会によってWebへの態度も異なる。「Googleにすべてを持っていかれるのでは」と心配する学会もあり、全学会でOKを取り付けるまでは苦労もあった。ただ最終的には「一般の人に論文の存在を伝え、学会を知ってもらえるのはメリットになる」という意識が広まり、全学会から理解を得ることができたという。
公開した効果はすでに現れ始めた。Google経由で閲覧されたCiNiiのページビューは、5月初めに10万を超え、直接CiNiiを訪れたユーザーの総PVを超えた。「今後もGoogle経由のアクセスが増えていくだろう」(阿蘇品さん)
Googleのロボット×手作業=知識へのアクセス
NIIは、その前身である「学術情報センター」時代から、国内の情報をまとめて発信するという役割を担ってきた。図書館の蔵書情報検索サービス「Webcat」「Webcat Plus」や、学術情報データベース「NII DBR」などを展開。書籍や論文の情報へのアクセス経路を整備してきた。
2005年にスタートしたCiNiiも、そんな取り組みの1つだ。CiNiiのデータは、マシンで情報を収集・整理するGoogleとは対照的。学者が手で書き、査読し、学会で精読し、学会誌に掲載した論文に、被引用数を手作業で確認して作っており、何人もの人が膨大な手間ひまをかけている。
人の手で整理した情報にはロボット検索にはない価値がある。「キーワード検索では、周辺の分野や、他の情報との関連性が見えづらい。手作業で整理した論文情報のページには、著者や掲載誌、引用情報などが書かれているから、ここを起点にして周辺情報に触れることができる」(大向氏)。各論文情報ページにはパーマネントリンクが付いており、それぞれのページが情報ポータルになる。
大向氏は、私見と断った上でこう語る。「例えば、検索結果にAmazonの本を見つけて実際に購入したり、検索で評判のいい店を見つけて行ってみたりと、Web検索が徐々に、Webの中だけで完結しなくなってきている」。Webの中で存在を知り、実際に手に入れるために足を動かすという動きは、今後も進んでいくとの見方だ。
「ロボット検索はすばらしいが、コンテンツを作っているのは個々の人。ものを作っている人が報われるようにしたい」(大向氏)。NIIは今後も情報公開を進め、Google以外のネット企業との連携にも積極的に取り組んでいきたいという。
関連記事
- NII、論文情報300万件をGoogleから検索可能に
- Yahoo!知恵袋のQ&Aを学術利用 NII
NIIは、ユーザーの質問にユーザーが答えるヤフーのサービス「Yahoo!知恵袋」の質問・回答データを、自然文検索や文章要約システムの研究などに活用する。 - 日本最大の電子論文アーカイブ、NIIが公開
国立情報学研究所と大学図書館が共同でSpringerとオックスフォード大出版局の電子アーカイブを導入し、公開を始めた。合計約610万の論文を電子化した国内最大のアーカイブに。 - 学術誌52誌をネット公開 湯川博士のノーベル賞論文も
- 日本人のアタマを救え──書籍検索でネットに“知の信頼性”を
ネット上には広告とうわさ話があふれ、信頼できる情報があまりに少ない──NIIの高野教授はそう考え、プロが編集した情報をネット上に引っ張り出そうと試みる。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.