サーチの「条件」 企業の戦略、論理を結果に反映できるかよく効くエンタープライズサーチの処方箋(2/3 ページ)

» 2007年03月08日 08時00分 公開
[富永康信(ロビンソン),ITmedia]

解そのものを提供するコンテクスチュアルインサイト

 同社の「FASTエンタープライズサーチプラットフォーム」(FAST ESP)は、1つのキーワードで各種の業務アプリケーションがつながるデータベース(DB)から情報を抜き取り、横断的に検索する同社の基盤技術(図1)であり、そこには3つの特徴がある。

図1 図1●FAST ESPのアーキテクチャー(クリックで拡大)

 1つは、コンテンツ分析とクエリ分析である。レガシーやアプリケーション、データベース、ファイルサーバ、音声/映像など、企業が持っている各種の情報から取り込んだデータに対しコンテンツ分析を行うことで、言語を問わず、共通のインデックスにして翻訳をかけ、ロジックを入れ込むという手段をとる。

 またクエリ分析では、例えば“クルマ”というキーワードに対し、「Car」「Auto」「トヨタ」などのさまざまな言葉もおもんぱかって抽出し、ユーザーごとの過去の経験を含めて検索結果に反映させている。

 2つ目は、スコープ検索。従来のトラディショナルな検索では、ドキュメントレベルに適合されているため、そのキーワードが含まれた関連性の薄い文書が検索結果の上位にランクされる場合がある。スコープサーチで実施されるコンテクスチュアルインサイト(*1)結果なら、センテンスレベルやパラグラフレベルに最適化されているため、情報の参照例ではなく、解自体を提供する結果となる。

図2 図2●エンティティ抽出のレポートサンプル画面(クリックで拡大)

 そして3つ目が、エンティティ抽出による検索精度の向上だ。ユーザーが何に興味を持っているのかを、文章中のエンティティ(人、場所、会社、日付など)を抽出し、インデックスを再構築することで、検索キーワードに関連性の高い情報を提示することができる。一種のセマンティックインデックスに近いものとなる。対象となるキーワードに関する記事や文章が、肯定的なものか否定的なものかを自動判定してマーキングすることもでき、IRやマーケティング部門などで利用されているという(図2)。


*1 コンテクスチュアルインサイト:次世代の検索適合度機能。ドキュメント全体ではなく文章レベルでの検索を可能にし、クエリとエンティティの関連性を考慮した結果を提示する。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ