実用化目前のセマンティック検索とビジネスへのインパクトNext Wave(2/3 ページ)

» 2009年06月25日 19時50分 公開
[富永康信(ロビンソン),ITmedia]

キーワード検索に代わる新たな検索技術の登場

 そして、検索トレンドの第2は、「検索対象の情報の中身を正確に理解する技術」である。従来型のキーワード検索を改良したものとして、エンタープライズサーチの多くがトピック抽出型検索技術を採用しているが、これはキーワードの有無のみならず、検索対象の文章に含まれる単語の出現パターンと何について書かれた文章(トピック)なのか判断する技術。だが、キーワード検索もトピック検索も統計処理によるもので、文章の中身を理解するものではない。

 そこで注目されているのが「セマンティック検索技術」である。セマンティック検索とは、メタデータ(意味情報の付与)とオントロジ(語彙と語彙との関係性の定義)という2つの技術をベースに、より検索対象の文章が持つ意味そのものを理解させようとする技術である。オントロジとは聞き慣れないが、例えば「歯医者」は医者という職業の下位概念で職種の1つを表し、歯科と歯科医院と同意語として扱う、といった技術だ。

 今年3月、Googleは自社の検索エンジンにセマンティック検索技術の採用を明らかにした。従来のキーワードマッチングに限界を感じていた同社は、概念レベルでの検索やフレーズの意味を理解する検索技術の開発に注力していることをエリック・シュミットCEOなどが表明していたが、実は競合他社は既にセマンティック検索技術を取り入れていた。

 マイクロソフトは昨年、セマンティック技術を手がけるPowersetを買収し、その技術を検索サイト「Bing」(旧Live Search)に採用。また、IE8にWeb ページのお気に入りの部分を持ち運びできる「WebSlices」 を追加したこともセマンティック戦略の一環といえるだろう。

 Yahoo!は、2008年3月にオープン検索プラットフォーム「SearchMonkey」のセマンティック標準(マイクロフォーマット、RDF)を採用したことで、既に9つのオントロジーの取り込みに成功している。ちなみにマイクロフォーマットとはWebページの情報に意味を与え構造化する仕組みで、人のために書かれたWebページ上の情報を、コンピュータでも処理できるようになる。RDFはResource Description Frameworkの略で、メタデータを記述する枠組みを提供する規約である。Webを通じて異なるアプリケーション間でのデータの交換が容易になる。

セマンティック検索の基本技術を構成するメタデータ技術とオントロジー技術の例

セマンティック検索の実用化度とは

 武居氏によると「セマンティック検索を実現するための技術はすでに実用段階にある」という。ただし、メタデータをどのように付与するか、オントロジをどうやって作るのかといった労力の部分が壁になっている。そのため、マイクロソフトもYahoo!もセマンティック検索対象は一部の範囲にとどまっているのが現状だ。メタデータは自動付与ツールを使って範囲拡大を効率化し、オントロジも対象領域を絞り込むことで構築の負担を軽減することで作業を加速していくことになるだろう。

 既に海外では、コンテンツ管理やナレッジマネジメント分野でセマンティック検索技術が採用されており、従来のキーワード検索に置き換わる変化が進んでいる。あるリポートでは、セマンティック検索を応用したアプリケーション市場は2010年に約200億ドル、2015年には1200億ドル規模になるという予測もある。

 しかしそれは英語圏での話。日本語におけるセマンティック検索はまだ事例は少ないが、経済産業省の「情報大航海プロジェクト」や文部科学省の「情報爆発時代に向けた新しいIT基盤技術の研究」(通称、情報爆発プロジェクト)など、国を挙げた日本語解析技術の開発が進みつつあることで、日本語でもメタデータの自動抽出や日本語で記述されたオントロジも登場している。

 武居氏は、「そろそろ日本でも、セマンティック技術を応用したアプリケーションを検討してもいい時期に差し掛かっているのではないか」と述べている。

 統計的に作成された連想辞書を用いる検索技術も、意味的関係を記述したオントロジに置き換えることで統計的な辞書では実現できない意味的関連語を提示することができる。

 また、感性検索や対話型検索においても、セマンティック検索技術を要素技術として取り込むことで、対話などから利用者の意図を推測し、より目的に合った情報のマッチングが可能となる。

実用化段階に差し掛かるセマンティック検索

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ