Hyper Estraier──APIが公開された検索エンジン

この世にはさまざまなオープンソース・ソフトウェアが存在する。しかし、世に知られていないものも多い。さまざまな分野の特選オープンソース・ソフトウェアを紹介しよう。

» 2005年08月30日 14時00分 公開
[中津川篤司,ITmedia]

 新しいサイトを立ち上げる際、サイト内検索はいかにすべきか、いつも悩んでしまう。DB内のデータであれば相応のシステムを組むが、静的なHTMLによる情報もあるからだ。

 簡単に済まそうと思うとGoogle検索を利用する方法になるのだが、企業サイト内にGoogleロゴは控えたいという意識もあるだろう。それに更新頻度や網羅性を考えると物足りないところもある。

 ここで紹介するオープンソース・ソフトウェアはHyper Estraier、全文検索エンジンだ。情報処理推進機構(IPA)による2004年度第2回未踏ソフトウェア創造事業の支援を受けて開発されたもので、LGPLで公開されている。作者のサイトにはHyper Estraierのデモサイトも用意されている。

Hyper Estraier Hyper Estraier

 検索方式はインデックス構築型になる。最初の構築後は自動で更新させる方法となるだろう。基本の対応形式はプレーンテキスト、HTMLなどだが、フィルタを自作することで増やすこともできる。

 最大の特徴はAPIが公開されていることだろう。これにより、他のシステムと連携させながら動作させることができる。商品の検索はDB、静的な情報はHyper Estraierと切り分けられるのだ。

 また、特徴としてP2Pも挙げておこう。データベースを別サーバ上に持たせることで、負荷分散や並列処理、巨大なインデックスの扱いを容易にすることができる。この部分についてもAPIがあり、プロトコルなどを意識することなく開発を進めることができる。

 検索エンジンは今やネットの世界に欠かすことが出来なくなっている。かと言ってシステム自体は複雑であり、一朝一夕に高性能なものができるわけではない。Hyper Estraierを知っておけば、きっと役に立つ時が来るだろう。

クリエイティブ・コモンズ・ライセンス

content on this article is licensed under a Creative Commons License.

注目のテーマ