アベレット そのようなシナリオにはまだ完全には対応できないと思いますが、われわれはメタデータの充実に非常に力を入れました。その結果、複数のファイルタイプ間および複数のユーザーシナリオ間での関連付けが非常に容易になりました。
Outlookを使っている場合、[Start]メニューからすべての電子メールに対して検索を行うことができます。キーワードによる検索に加え、構造化照会言語も使えます。また、「From Bob」(ボブからのメール)と入力して検索することも可能です。電子メールストアと実際のファイルシステムとの間でシームレスな統合が実現されているのです。
―― ユーザーは検索範囲に関する従来の制約から解放されるのでしょうか。例えば、Outlookでは一度に1つのフォルダ内しか検索できないといった制約です。
アベレット もちろんです。検索時に物理的な境界を超える機能を実装しました。ユーザーが検索を実行するとき、実際にはインデックスを検索しているわけです。これは、理解可能なすべての情報を格納した巨大なデータベースです。
次の大きな課題は、理解できない情報をどうするかということです。現在、インデクサーはファイルシステムを理解できます。すなわち、テキストファイル、Wordファイル、PowerPoint、JPEGといった類のものは理解できるのです。しかし、どれが適切なデータかを推測する方法がよく分からない巨大なバイナリデータ塊もたくさんあります。
その好例が、OutlookのMAPI(Messaging API)ストアです。われわれは、それをこじ開けるためのプロトコルハンドラを作成しました。これにより、単一の電子メールをWindows上のデータ項目として表すことが可能となりました。この機能は大きな可能性を秘めており、Windowsが理解できる通常のファイルタイプではないデータを検索する能力を拡大するものであると考えています。
―― ファイルフォーマットは2つの方向に向かっているように思えます。一方には、XMLファイルのようにタグが付いた冗舌なファイルがあります。こういったファイルでは、その意味に関連するデータを抽出しやすくなっています。その一方では、リッチメディア型データ用の圧縮ルーチンがあり、そのアウトプットは無意味なノイズのように見えます。アプリケーション固有のコンテンツを検索エンジンから見えるようにしようと考えている開発者にとって、大きなチャンスならびにニーズがあるのですか。
アベレット われわれの一般的なプロパティストアは、ファイルに割り当てられるプロパティタイプの巨大な集合ですが、これを拡張することも可能です。われわれがいつも例として挙げるのは、法務部門のユーザーであれば、「legal review by」(法務審査担当者)といったような新しいメタデータタイプ用にプロパティハンドラを作成し、そのメタデータをシステムに組み込めば、Windowsがそれを理解できるようになるというものです。
―― 検索に関連した権限はどれくらい細かく設定できるのでしょうか。例えば、ある人からある人に特定のメモがいついつまでに送られたという事実そのものが、機密を要する情報である可能性もあるのではないでしょうか。たとえ、わたしがそのメモを読むことができないとしてもです。
アベレット 確かにそれは非常に重要なポイントであり、われわれもそれに関しては2つの視点から考えました。1つは、インデクサーに自然な信頼境界を実装したことです。ファイルシステムの観点から言えば、読む権限を与えられていないものを検索することはできません。それが存在することさえ分からないのです。
こうすることで、ユーザーが権限のないデータにアクセスするのを防ぐことができます。もう1つの視点は、ユーザーが「これはわたしだけしか見ないデータだから、どんなメタデータを付けてもいい」と考えて、例えば「バカな上司からのメール」といったタグを付けた場合です。こういったケースを想定して、われわれはクリーニング機能も用意しました。ファイルを送信するときに、それに付随するメタデータをすべて除去することができるのです。これも拡張可能な機能です。例えば、一部のメタデータが社内用で、一部が社外用といった場合、社内用のメタデータを自動的に消去し、社外用のメタデータだけを残すようなクリーナーを作成するといったことも可能でしょう。
―― その機能をプラグイン的な方法でファイルタイプに関連付け、ユーザーが「これをクリーニングする」と指示するだけで、社内用と社外用の各「クリーン」バージョンが作成されるようにすることも可能なのでしょうか。
アベレット もちろんです。
―― Vistaのタグ付け機能は、NTFS(NT File System)データ構造専用なのですか。
アベレット 結局は、ファイルそれ自体がサポートするプロパティセットによって決まります。ほとんどあらゆるファイルタイプでは、それがサポートするすべてのプロパティタイプに関するヘッダがファイルに埋め込まれています。つまり、検索と参照、そして検索用の新しいデータの追加が可能なブリッジインフラが存在するわけです。
Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.