特集
» 2007年11月08日 13時10分 公開

検索エンジン系ツールの見取り図次世代検索の行き先(2/2 ページ)

[藤村能光,ITmedia]
前のページへ 1|2       

ESP

 ESP(Enterprise Search Platform)は、企業内に存在するあらゆる情報(コンテンツ)やデータを対象に検索機能を提供するプラットフォームのことを指し、ファイルサーバにあるHTML、PDF、Wordなどに加え、データベースや業務アプリケーションが作成したさまざまな形式のファイルなども横断検索できる。

 ESPを一言でいうと、クエリから関連性の高いコンテンツを探すものであるが、その実現は容易ではない。エンティティ(実体:誰が、いつ、何を、といった情報)や自動カテゴリー化、自然言語処理といった最新技術が必要になる。

ビジネスインテリジェンス

 組織内にはCRMなどのシステムが生成する構造化データと、文書や電子メール、画像といった非構造化データの2種類がある。構造化データから目的の結果を探すツールがビジネスインテリジェンス(BI)だ。非構造化データを扱う検索エンジンと類似性があるといえる。

 BIの対象となる構造化データは、データウェアハウスなどのデータベースに格納されており、ユーザーがデータを利用するには、データベースの構造やSQLの知識が必要となる。BIはこれらの知識を持たないユーザーでも簡単に構造化データを利用できる仕組みを提供している。

 近年ユーザー側が構造化・非構造化データを区別せずに検索結果を得たいというニーズが高まっていることから、今後はBIと検索エンジンが統合していく動きが見られるかもしれない。

画像、マルチメディア検索

 検索エンジンが提供する画像検索は、画像の内容を解析するのではなく、クローリングの際に画像ファイルの周りにあるテキストや、画像を挿入するためのIMGタグに付加されるALT情報をキーワードとして拾い、検索するものが多い。こういった画像検索は、ユーザーが欲しい情報の周辺にある情報を集めるもので、主に人名、地名、商品名など固有名詞を探し出すのに適している。

 これとは別に、画像の特徴などの直感的な情報から、類似した画像を集めるといった画像内容の検索に関する研究も進められている。画像上の形や構図、色の分布といったデータを数値化し、検索の際には各要素の数値データが近いものを画像として選ぶ「類似画像検索技術」や、サムネイル画像と画像があるWebページの文字情報を併せて検索可能にする「画像クラスタリング技術」などがある。


 検索エンジンには大きく分けてこれらのものがあるが、情報量が膨大になりすぎた現在では、情報が見つからないケースより見つかりすぎるケースのほうが多くなってしまったといえる。次回は、これらの課題を解決する検索エンジンの事例を取り上げる。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ