Preferred Infrastructure、あいまい検索処理を高速に行える検索エンジンを発表

Preferred Infrastructureは、最先端の文字列検索アルゴリズムを利用し、あいまい検索処理を高速に実現する検索エンジン「Sedue Flex」を発表した。10%から20%の誤りを許した全文検索を、Gバイト級のデータに対しても数ミリ秒〜数秒のオーダーで検索可能。

» 2007年03月05日 16時17分 公開
[ITmedia]

 Preferred Infrastructureは3月5日、最先端の文字列検索アルゴリズムを利用し、あいまい検索処理を高速に実現する検索エンジン「Sedue Flex」を発表した。ゲノム解析やノイズの含まれたデータに対する検索など、高速・高度なあいまい検索機能を必要とするユーザーがターゲットとなる。

 同エンジンは、同社が開発した全文検索技術「Sedue」をベースにしたもので、最新のアルゴリズムを利用することでゲノムや音声データなどの検索に必要とされる「あいまい全文検索」を高速な処理できる検索エンジン。あいまい全文検索では、検索対象から検索語と「完全に」一致する部分だけでなく、検索語から一定数の文字列の挿入、置換、欠落を許して一致する部分を得ることもできる検索で、誤字、脱字、表記ゆれをカバーして検索が行える。同エンジンでは、10%から20%の誤りを許した全文検索を、Gバイト級のデータに対しても数ミリ秒〜数秒のオーダーで検索可能であるとしている。

 今回開発したエンジンは、どのような長さの文字列に対してもあいまい検索を可能にしたことで、従来の手法では実現できなかった高度なゲノム解析処理やノイズを含んだデータに対する検索を実現可能にした。特に、ゲノム解析においては従来手法では困難であった、50塩基程度の短い長さの塩基配列に対するミスマッチあり(一部の文字が異なる)・ギャップあり(一部の文字が欠落・追加している)の検索も可能となる。

 動作OSはLinux(Fedora Core 4/5/6およびCentOS 3/4で動作確認済み)。ライセンス形態としては、「1サーバあたり」「月間の使用量」「プロジェクトごと」が用意され、価格はオープン。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ