特集
» 2007年11月08日 13時10分 公開

次世代検索の行き先:検索エンジン系ツールの見取り図 (1/2)

探すという行為を行うのに、検索エンジンはもはや欠かすことのできないものとなっている。現在、検索エンジンにはどのようなものがあるのか。まずはそれを知ることから始めよう。

[藤村能光,ITmedia]

このコンテンツは、オンライン・ムック「次世代検索の行き先」のコンテンツです。関連する記事はこちらでご覧になれます。


 「探す」という行為は、生きていく上で必要不可欠なものだ。われわれはこれまでも探すための方法を試行錯誤し、検索にかかる時間と労力を減らす努力を続けてきた。

 コンピュータとネットワークが登場してから10年以上が経つ。Web上に蓄積される情報は日々増加し、アナログで管理されてきたデータはデジタル化(形式知化)されるようになった。誰もがPCを使うようになり、自分だけが持つ情報(暗黙知)を簡単にデータ化することができる。しかし、情報を分類・整理しないまま形式知化する人が多くなった結果、検索がうまくできなくなってしまった。

 それに準じて必要性を増してきたのが検索エンジンだ。検索エンジンは、検索のニーズやシーン、内容に応じていくつかに使い分けられている。ここでは、ソフトバンク・クリエイティブ発行みずほ情報総研編著「サーチアーキテクチャ」での分類を基に、検索エンジン系ツールをいくつか紹介する。

ディレクトリ型検索エンジン

 人間の手でページをカテゴリー分類するのがディレクトリ型検索エンジンだ。サーファーと呼ばれる専門の人間が日々インターネットを巡回してページを探し、検索情報を登録する。人間による一定の選別が行われるため、結果の品質が保証される。ユーザーは質の高い情報を得られる点にメリットがある。

 その一方で、分類と登録作業に多大な時間とコストを要することが問題に挙がる。大量に新規情報が生成・更新される場合、対象となる情報の収集や登録が間に合わなくなる。また、分類の粒度が大きくなることも問題だ。インターネットの場合、ホームページ単位で登録分類を行うため一番上位のページ内容が分類要素になる。その結果、トップページと異なる内容を含むホームページ配下の別ページ群でもトップページと同じ分類になることがある。

デスクトップサーチ

 その名の通り、PCの中に格納された膨大なファイルを検索するもの。これまではWindowsのエクスプローラなど使ってフォルダツリーを下にたどり、ファイル名の一覧から探す方法が取られていたが、情報が増えるにつれ目的のファイルが見つけ出せないことが多くなった。これらの動きから、デスクトップサーチのアプリケーションが提供されるようになった。やみくもにキーワード検索すると大量の検索結果が返ってくるため、ファイルの場所に目星をつけ、最後の絞り込みに使用するのが一般的だ。

ブログ検索エンジン

 ブログ検索エンジンは、基本的には通常の検索エンジンと同じ機能を持つが、データ収集のスピードを向上させたほか、パーマネントリンク(ブログの1つの記事に与えられたURL)をブログ本体部分と分けて解析をしたり、出力されるRSSを分析できる。定期的なクローリングでインデックスを作成するWeb検索に比べて、クローリングの手間を省力化できるほか、フィード内の構造化データから投稿や対象期間をより正確に指定できる。ユーザーの目的や狙いに合わせた検索が可能となる。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ

マーケット解説

- PR -