ITmedia NEWS > 企業・業界動向 >
コラム
» 2008年10月23日 13時54分 公開

Googleが社内文書を検索できないって?

「検索最大手」のGoogleでさえ、裁判に提出する書類を探すために社内の電子ファイルを検索することは過大な負担になると主張している。

[Larry Seltzer,eWEEK]
eWEEK

 産業界や法曹界で、電子情報開示の方法について法的および技術的な模索が依然として続いている。技術は急速に進歩しているが、産業界の主張と法律家の主張は必ずしも一致していない。

 企業は法的要求に対応する際、考えられる限りのとんでもないでたらめを並べることがある。企業がうそをついたと証明するのは難しいかもしれないが、企業が法的手続きの円滑な進行の妨げになり得るのは確かだ。最近の訴訟におけるGoogleの対応を見てみよう。

 この訴訟は、Sprint NextelがClearwireとの合弁会社を通じて進めるWiMAX事業をめぐって、Sprint Nextelと一部の関連会社の間で争われているもの。Googleはこの合弁会社への出資企業の1つで、出資に関連する書類の提出を求める召喚状を受け取った。だが、Googleはこれに対し、社内の電子ファイルを検索することは過大な負担になるとの見解を示した。Googleの弁護士は次のような回答を提出した。「Googleは、そうした検索を行うことはできるが、社内電子メールシステムの関係上、同様の状況にあるほかの企業ほど簡単かつ安価に行うことはできない」。これを受けて提起された、Googleに証拠開示を強制するよう求める申し立てについては、ここをクリック(PDF)

 (注:これはGoogle側の妨害行為だったかもしれないが、おそらく、それは悪いことではない。何といっても、Googleの基本理念は、「悪事を働かなくても金もうけはできる」なのだから。だがもちろん、同社の基本理念には、「1つのことを極めて本当にうまくやるのが一番」で、「Googleは検索を行う会社」というものも含まれる。となると、やはりGoogleの対応には筋が通らないところがある。もっと調べなければならないが、われわれはそうした調査を、一部の同様の状況にあるコラムニストほど簡単かつ安価に行える態勢が整っていない。)

 こうしたことから考えると、関連する企業は、法的手続きにかかわる文書を保存し、徹底的に検索するための実効ある技術的方策の実施を求められるようになるだろう。この方策には、検索や法的保存などのさまざまな製品がかかわる。訴訟の証拠となる電子文書の一般的な検索方法は、「原告、被告双方の弁護士が検索条件、つまりキーワードについて合意し、それを使って検索を行う」というものだ。皆さんが自分でキーワード検索を行った経験からお分かりのように、検索結果には、目的の情報を含む文書がおそらく含まれるが、誤検出により、目的に合わない文書も検索に多数引っ掛かる。また、目的の情報に関連する可能性があるが、検索条件を厳密には満たさない多くの文書が、はじかれてしまう。

 では、検索で見つかった文書はどうなるのか。それらは、訴訟のために使用できるように、また、破棄されたり改ざんされたりしないように、保存しなければならないというルールになっている。そのための昔ながらの方法は、対象文書をコピーしてCD-ROMに焼き付け、弁護士のオフィスの(物理的な)ファイルフォルダに収めるというものだ。

 企業弁護士が最も心配しているのは誤検出だ。つまり、問題の件と無関係ながら、機密情報が漏れる可能性のある文書が検索され、それらを社外に出してしまうことを恐れているわけだ。一方、裁判所が最も懸念しているのは、問題の件と関連する文書が電子検索の結果に含まれないという検出漏れだ。

 このことについてワシントンD.C.の連邦地裁のジョン・M・ファシオラ治安判事や、多くの弁護士と話した結果、わたしが得た認識は、彼らは、「こうした文書検索を改善する技術が利用できるようになっている、あるいは、近いうちにそうなると考えており、企業がそれらを利用することを期待している」というものだ。そうした技術の中でも注目されているのが、「概念検索」だ。

 概念検索の考え方は、キーワードを正確に打ち込まなくても、目的の情報を検索でヒットさせることができるというものだ。そうなれば、誤検出や検出漏れも減るだろう。だが、概念検索はどのような仕組みで実現されるのか。ソフトベンダーのRecommindによると、まずユーザーが一連のキーワード検索を行い、それぞれの検索結果から、目的の情報との関連度が特に高い文書を数件選び出す。次に、ソフトウェアがそれらの文書を分析し、キーワードがそれらの中でどのように使われているかを調べる。さらに、ソフトウェアが分析結果を文書データベースにフィードバックし、そうしたキーワードの使われ方の背景にある概念に関連する文書を見つけ出し、トピック別に分類する。少なくとも、同社はそう主張している。実際にこうして検索が行われるのを見たことはない。だが、考え方としては一理ある。この分野に影響力を持つファシオラ判事は、わたしと話した際、概念検索の考え方を盛んに強調した。

 法的保存については、Recommindは現在、「Insite Legal Hold」という新製品を持っている。同社の概念検索ソフトと連携するこのソフトにより、ユーザーはまず、検索結果から手動で誤検出をチェックし、続いて目的の文書を安全に保存できる。検索基準を満たす新規文書を自動的に保存することも可能だ。

 こうした電子リポジトリによる保存は、弁護士のオフィスのファイルキャビネットにCDを保管する方式よりなぜ優れているのか。まず、もちろん弁護士は信頼できるが、デジタルリポジトリは大抵、文書が改ざんされていないことを証明する何らかの機能を備えているからだ。そうした機能は、結局はシステム管理者や社内弁護士への信頼を前提にしたものかもしれないが、それでも、価値があるのは確かだ。また、新規文書を作成時に保存できる機能も有益そうだ。ただし、この機能は、文書が保存されて変更できなくなる前に、社内弁護士が文書チェックを行う機会があるように、慎重に構成しなければならない。

 法的文書を扱うための以上のような新技術は、クールな上に将来性もある。しかし、従来の確立した方法を補完するために利用するのが賢明だろう。

 こうした技術は、訴訟の円滑な進行が求められる中でますます必要性が顕在化しており、今後数年で急激に成長するだろう。それらの技術の助けを借りれば、Googleのように技術的に遅れた企業も法的義務を順守できるようになる。

Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.