ビジネスで爽快な「出し抜き感覚」が得られるデスクトップ検索ソフト「ConceptSearch」(2/3 ページ)

» 2005年02月23日 00時00分 公開
[竹村譲,ITmedia]

 ConceptSearchの処理対象となるファイル形式は、企業や個人に導入実績の高い「MS Office」製品や「一太郎」、「Lotus 1-2-3」を始め、PDF形式の書類やプレーンテキストからリッチテキスト、HTML文書など、その守備範囲は広範だ。メールソフトの場合、「Outlook Express5.x/6」、「Shuriken1.0/2.x/Pro〜Pro3」や「Becky! Internet Mail 1.25/2.11」を対象に、メール本文の全文検索だけでなく、対応した文書形式なら、添付ファイルの中身も検索できる。

 物理的にも、クライアントPC内部のハードディスクだけに限らず、「Eドライブ」などドライブレターを割り振ることの可能なUSBインタフェース経由の外部ドライブや、NAS(Network Attached Storage)などのストレージメディアも対象とすることができる。ドライブ全部でも、「マイドキュメント」フォルダのようにフォルダ単位でも、フレキシブルにその収録データファイルを検索・活用の対象とすることが可能だ。

 ConceptSearchは、最初の導入時にのみ、検索・活用の対象となるファイルや、ドライブ、フォルダ単位で、すべての収録文章データの解析とデータベース(DB)化が必要だ。DB化と言っても複雑な処理ではなく、目的のドライブやフォルダを登録するだけで、後はConceptSearchが自動的にやってくれる。

 この操作を最初に1回だけ行うことで、以降は、その後追加された新しい文章データのみのDB化、その部分の元DBへの追加作業を、ユーザーが設定した日時に、繰り返し自動的に行ってくれる(スケジュール処理機能)。もちろん、逐次、マニュアル操作も可能だ。

 また、一度検索して見つけた文章をブックマークしておくこともできる。これによって同じ検索する手間を省くとともに、よく利用する文書をブックマークしておくことで瞬時に文書を探し出す「文書管理ツール」的な使い方も可能だ。

自然な文章表現で目的の情報が見つかる「仕組み」

 クライアント内部に存在する既存文章のDB化プロセスにおいて、同社の上位商品であるConceptBaseで採用されている「言語処理技術」が生かされている。

 普通、人間は、よほど鈍い人か、一般的な常識から逸脱している人でなければ、自分に送られてきたメールの文章を読めば、差出人がご機嫌なのか、ご機嫌斜めなのか、不満があるのか、もし不満があるのなら、それは何を不満に思っているのか、いとも簡単に判断できるだろう。これは人間がその文章の中身を単なる単語の連続ではなく、その文字間にある意味合いや形容詞の位置、否定形の文章などを、生まれてから今までの経験によって判断できるからだ。

 だが、人にとってはいとも簡単なこれらの判断も、コンピュータにとっては非常に難しいモノになる。

 ジャストシステムのConceptBaseに採用されている「言語処理技術」は、人ではないコンピュータが、まず文章の中に登場する多くの単語を、名詞や形容詞、動詞、副詞などに分割する。次に否定形などの表現を加え、高度に分析、解析し、さらに、文章中に登場する単語の頻度数から文章全体の類似度を探る。

 また、特定文章の傾向の重み付けを、他の文章に対する同様の解析と比較しながら繰り返し行う。そして、繰り返し行われたそれらの最終的結果から得られる解析データを元に、単語を軸とした3次元の文章データベース空間に、各文章を配置する作業を行う。

 こうして既に解析され、蓄積された文章データベースが存在することで、ユーザーは一般的な検索エンジンで行われるような、単なる単語やキーワードの羅列やAND/OR文ではなく、「文書共有の方法について」とか「ブランド管理とIT系企業戦略に関して」といった日常的に使用する「自然な文章表現」の入力で、類似する目的データや文章を効率良く探し当てることが可能となる。

 また、既に表示された結果に対して、検索語彙(ごい)の追加や日付、期間、文書属性などを追加し、絞り込みを行うことも可能だ。一度検索した過去の検索時の検索条件や絞り込み条件もシステムには記憶されているので、再検索時の効率も高い。

過去の検索履歴から再度、同じ検索を実行し、強調表示させた場合。このような操作を繰り返し、目的のデータを見つけ、新しいレポートや提案書などを作成する基礎データとすることが十分可能だ
検索結果を確認した後、新たに検索条件を付加して絞り込みを行うことも可能だ。これらを繰り返して目的にジャストフィットするデータを自分のクライアントPCから探し出すことができる。いつの時代も、一番役に立つデータは、同じ職場の仲間の作ったデータや、社外の他人から定期的に送られてくる会議の議事録やプロジェクトの管理メールなどであることが多い。こと「情報活用」において「他人のふんどしで相撲をとる」ことは、悪いことではない

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年03月29日 更新
  1. ミリ波レーダーで高度な検知を実現する「スマート人感センサーFP2」を試す 室内の転倒検出や睡眠モニターも実現 (2024年03月28日)
  2. Synology「BeeStation」は、“NASに興味があるけど未導入”な人に勧めたい 買い切り型で自分だけの4TBクラウドストレージを簡単に構築できる (2024年03月27日)
  3. ダイソーで330円の「手になじむワイヤレスマウス」を試す 名前通りの持ちやすさは“お値段以上”だが難点も (2024年03月27日)
  4. 「ThinkPad」2024年モデルは何が変わった? 見どころをチェック! (2024年03月26日)
  5. ダイソーで550円で売っている「充電式ワイヤレスマウス」が意外と優秀 平たいボディーは携帯性抜群! (2024年03月25日)
  6. 日本HP、個人/法人向けノート「Envy」「HP EliteBook」「HP ZBook」にCore Ultra搭載の新モデルを一挙投入 (2024年03月28日)
  7. 次期永続ライセンス版の「Microsoft Office 2024」が2024年後半提供開始/macOS Sonoma 14.4のアップグレードでJavaがクラッシュ (2024年03月24日)
  8. そのあふれる自信はどこから? Intelが半導体「受託生産」の成功を確信する理由【中編】 (2024年03月29日)
  9. 日本HP、“量子コンピューティングによる攻撃”も見据えたセキュリティ強化の法人向けPCをアピール (2024年03月28日)
  10. サンワ、Windows Helloに対応したUSB Type-C指紋認証センサー (2024年03月27日)
最新トピックスPR

過去記事カレンダー