ITmedia NEWS >

Googleの検索サーバ、5倍強力な新バージョン登場

» 2004年06月02日 19時58分 公開
[IDG Japan]
IDG

 Googleは「Search Appliance」をアップグレードし、キャパシティとパフォーマンスを改善した。この製品はハードとソフトを組み合わせて、Google.comサイトで使われている検索機能を提供する。

 同製品は2002年初頭に投入され、自身のサイトをGoogle技術で検索できるようにしたいと考える企業、教育機関、政府機関を対象としている。大学がGoogle Search Applianceを購入して、公共のWebサイトに加えて、学生・職員用イントラネットを検索する機能を提供するといったように利用されている。

 アップグレードによって、これまで以上の文書をよりインテリジェントにインデックス化できるようになり、1分当たりのクエリー処理件数も増加したとGoogleのエンタープライズ部門ジェネラルマネジャー、デイブ・ジルアード氏は説明する。またこの新版ではセキュリティが改善され、インデックス化した文書をより柔軟に詳細に区分できるようになっているという。

 「当社はこの製品を2002年にひっそりと立ち上げたが、これは順調に成長し、当社にとって成功事業となった。今回はこの製品の初めてのメジャーアップグレードだ」(同氏)

 パフォーマンス強化に関して言うと、新版では最初のバージョンの5倍にあたる150万の文書をインデックス化でき、1分当たりのクエリー処理件数は300件と、こちらも5倍に改善されていると同氏。

 また新版では、よりインテリジェントで効率の良い文書のクローリングが特徴となっている。最初のバージョンではバッチ形式でクローリングを行っていた。つまり管理者が指定した時間ごとにすべての文書をスキャンし、インデックス化していた。新版では前回のクローリングの後で変更された文書のみをスキャンし、インデックス化する。これによりクローリングプロセスは迅速化され、帯域と処理能力の消費が抑えられるとGoogleは話している。

 さらに、新版では絶えずクローリングを行い、変更が即座にインデックスに反映されるため、管理者は更新スケジュールを設定しなくてもいい。最初のバージョンは1日に1回、あるいは2日おきといった間隔でバッチ更新を行うよう設定されるため、更新が行われるまで変更の反映が遅れるが、新版では変更が行われたらすぐにそれを検出するとジルアード氏は説明する。

 また新版では、ユーザーがアクセス禁止の文書を閲覧するのを防ぐ機能が改善され、セキュリティが強化されていると同氏。この製品はクエリー実行後に検索キーワードを含むすべての文書を集め、クエリーを行ったユーザーに応じてこれらの文書をフィルタリングし、閲覧が許可されている文書だけを表示するという。

 このほか、さまざまな文書の集合を作成する新機能もある。最初のバージョンでは1つの集合しか作成できなかったが、新版では、営業・マーケティング担当者が検索できる集合と、コールセンタースタッフが検索できる別の集合を作成するといったことが可能だ。

 これに関連する新機能として、1つの集合に対して異なるユーザーインタフェースをサポートできる。管理者が営業・マーケティング担当者とコールセンタースタッフ向けに別々のユーザーインタフェースを設定し、両者に同じ文書の集合を提供することも可能だとジルアード氏。

 新版Search Applianceは、ハードの強化により発熱量が増え、冷却のために必要なスペースが拡大しているため、高さが最初のバージョンの2倍になっているという。高さは2U(3.5インチ)で幅は19インチだ。

 Googleはこの製品のハード製造を担当したベンダーを明かしていない。「一般的なハードだ。Googleのデータセンターで使っている汎用ハードと同じものだ」とジルアード氏。

 同氏によると、Search Applianceの基本的な導入はわずか30分で完了するため、IS(情報システム)部門は1時間足らずでこれを稼動させられるという。さらにカスタマイズする場合は、導入にもっと時間がかかるだろう。

 この製品はHTTP経由でアクセスできるものであれば、250種類以上のファイル形式の文書をクローリング、インデックス化できる。28カ国語をサポートし、自然言語検索、キーワード検索、ブール代数などにも対応する。

 検索結果のキャッシュの表示、日付による並べ替え、検索結果内の検索も可能で、検索語の正しいスペルを表示する自己学習型スペルチェッカーも備わっている。管理者は利用報告の作成やクローリング分析が可能だ。

 Search Applianceは「GB 1001」のモデルナンバーで単体のデバイスとして販売されている。ジルアード氏によると、15万件の文書をインデックス化できるモデルは3万2000ドルから、最大キャパシティ150万件のモデルは17万5000ドル。価格には2年間のカスタマーサポートが含まれている。GB 1001の新版は既に提供開始されている。

 またこの製品は、設定済みのGB 1001を複数積み重ねた形でも販売されている。「GB 5005」は5台のデバイスを重ねたもので、GB 8008は12台だ(最初のバージョンでは、GB 8008は8台だった)。これらのデバイスが連係するよう、Googleが事前に設定していると同氏は説明している。

 本稿掲載の時点では、これらスタック式製品の新版でどれだけパフォーマンスが改善されたかについて、Googleには具体的な数値がないとジルアード氏は話していた。これら製品の価格はインデックス化できる文書の数によって決まるという。

Copyright(C) IDG Japan, Inc. All Rights Reserved.