情報を紡ぎ出すConceptBase、いま企業に求められる情報ハブとは?エンタープライズサーチ新時代(1/2 ページ)

組織の枠を超え、溢れる情報の中から価値ある情報を共有、活用したいというニーズは高まるばかりだ。どのようにしたらユーザーが信頼できる情報に素早くたどり着けるのか? ジャストシステムが着目したのは、企業で使われる文書の「構造」だった。

» 2008年09月01日 11時19分 公開
[浅井英二,ITmedia]

 遍在化したインターネットがデジタルデータを爆発的に増加させたのはご存じのとおりだ。ブログに代表されるCGM(Consumer Generated Media)の台頭もそれに拍車を掛ける。そのため、情報の洪水から有用な情報を取捨選択して生かすために、検索技術が欠かせなくなっている。手軽に情報にアクセスできるインターネットとそれを活用する検索技術の恩恵は、われわれの普段の生活の中でも十二分に感じられる。

 一方、企業でも組織の枠を超え、溢れる情報の中から価値ある情報を共有、活用したいというニーズは高まるばかりだ。Googleのような、いわゆるインターネット検索エンジンをアプライアンス化した企業向け製品もあるが、期待どおりには機能してくれない。キーワードを入力し、そのヒット結果に基づいて順番にファイルを開いてみる、といったインターネットと同じアプローチでは「生産性」や「創造性」の向上という点では限界があるからだ。ホワイトカラーの生産性改善を掲げてエンタープライズサーチ製品を導入した企業の多くが、その効果を実感できないでいるという。

ジャストシステムの浮川和宣社長

 「インターネット検索とエンタープライズサーチでは、期待値が全く違う」と話すのは、ジャストシステムの浮川和宣社長だ。

 「インターネットの世界は森羅万象。手掛かりはキーワードくらいしかないが、企業内の文書は違う。電子部品の専業メーカーであれば、それに関する文書が山のようにある。特定の業種、技術、商品のように、使用される言葉に偏りがあり、類似性の高い文書ばかり。キーワードだけで求めている情報をたどり着くのは難しい」(浮川氏)

 ジャストシステムは1997年に文書の概念類似検索技術を搭載したConceptBaseシリーズを世に出し、これまで3300社の導入実績を誇る。しかし、「類似検索」というユニーク技術も、テキスト処理の域を出ない。

 どのようにしたらユーザーが信頼できる情報に素早くたどり着けるのか? 同社が着目したのは、企業で使われる文書の「構造」だった。非構造化データの代表例である文書を自動解析して構造化し、メタ情報も付加、最終的にはXML化およびインデックス化することで壁を打ち破った。

 ご存じのとおり同社は2004年、企業の文書をXMLによって構造化し、再利用や、知識としての活用を促進するソリューションとして「xfy」を発表している。同事業は、浮川氏の期待どおりに進んでいないものの、技術やサービスのノウハウは、ConceptBaseの機能拡張に生かされている。

構造化で文書の中身に踏み込む

 文書は構造化/XML化することで、それまで単なる「0」と「1」の集まり(文字列)に過ぎなかったものがコンピュータにもより扱いやすくなる。新しいConceptBaseでは、文書の中身も構造化して取り込み、インデックス化するため、「構造」「セマンティック」(意味)、あるいは「外部情報」を組み合わせ、単に情報検索の精度を高めるだけでなく、ユーザーや状況に応じて最適な情報を提供することも可能となる。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ