スキャンした紙文書に改ざんはないといえる?e文書法の活用術(3/4 ページ)

» 2006年01月17日 08時50分 公開
[佐藤慶浩,ITmedia]

 さらに、紙文書の改ざんをどうやって見破るのかの経験もないと、そのために必要な条件を探ることができないだろう。つまり、自分の思いつく限りの改ざん見本を用意して、それを見抜くのに満足できる条件を使ったとしても、改ざんを見破るプロだけが知っているような高度な改ざん方法を見抜くのに不十分であれば、その条件では電子文書の有効性が後になって不十分と判断される可能性も残ってしまう。

ファイル保存形式の問題

 ここまで紙文書のスキャン時の説明をしたが、電子文書はスキャンしただけでは意味がない。それをシステム上のファイルとして保存する必要がある。それをどのようなファイル形式で保存するかについても報告書は触れている。

 これには、ファイルの圧縮方式として、可逆圧縮か非可逆圧縮のどちらを使用するのかが重要な要件となってくる。スキャン時の要件をファイルとして引き継いで維持するためには、本来は可逆圧縮方式に限定されるべきであるが、文書の用途によっては、非可逆圧縮でもよい場合もあるとの判断から、報告書は、圧縮方式については具体的な要件を示していない。このことは、非可逆圧縮方式でもよいが、その場合には、先に述べたように電子文書の有効性が後で不十分とされるリスクについては自身で判断せよという意味である。反対に可逆圧縮方式を選択すれば、圧縮方式についてのリスクはないということになる。

 しかし、色数と解像度が高い画像を可逆圧縮した場合、ファイルサイズは非常に大きなものとなり、あまり現実的ではない。例えば、100万画素数のカラー画像を非可逆圧縮のJPEG形式で保存すると200〜300Kバイトだが、圧縮されない状態では3Mバイトとなり、可逆圧縮では2Mバイト程度が必要となる。そこでおそらくは、非可逆圧縮を選択して、その圧縮率の決定をすることで、リスクを選択することになる。一般の企業としては、個別の十分条件が示される際に、非可逆圧縮の圧縮率の目安が欲しいところだろう。しかし、非可逆圧縮方式として最も普及しているJPEGのような空間周波数分解によるものでは、圧縮率を実用的なものとして定量的に示すことが困難であることはあまり知られていない。

 JPEG圧縮の基礎技術としてのパラメータは定量的に示すことが可能だが、ファイルの保存に市販のソフトウェアを使用することを考えると、それらのパラメータをどの程度詳細に設定できるかは、そのソフトウェアによって決まってしまう。通常はメーカーが用意した何段階かのパターンから選択するだけで、パラメータを個別には設定できない。そのため、個別の要件として、JPEG圧縮のパラメータが数学的に示されてしまうと、既存の市販ソフトウェアでそれを実現することは不可能になってしまうのだ。

 これを現実のものとするには、要求するパラメータのセットを何段階かでJIS規格などで定め、それに対応するソフトウェアが開発されるのを待つしかない。現実の製品市場では、国際規格も視野に入れないと、メーカーがそれに対応するかはどうか分からない。

 おそらく、民間では、「○○○○というソフトウェア製品の場JPEG合には、ファイル保存時の圧縮率として、レベル○○以上の画質を設定すること」という具体的な指定をしてもらいたいところだろう。例えば、「AdobeのPhotoshopを使用する場合には、ファイル保存時の画像オプションで画質6以上を設定すること」のような指定があれば悩まなくてよい。しかし、法令が定める個別要件に、民間企業の製品名と企業独自のレベル設定表現を記載するということは前例がほとんどない。どこまで具体的なものとなるかは疑問だ。それが示されなければ、保存した電子ファイルについて、後から役所に「これでは紙文書と同程度のものとしては不十分だ」と言われないとは限らないということになる。スキャン前の紙文書を廃棄してもよいかの決断はあまり簡単にはできないのだ。

 報告書では、圧縮率を抽象化した例として、用紙サイズに応じたファイルサイズの大きさを示している。圧縮前の原画像の特性によって圧縮率が大きく変わるため、これには疑問を持った人も多いだろう。報告書が示しているのは、その前に例示している「JIS X 6933」や「JIS Z 6014」のテストチャートを目安にしている。そのことから、自分の使っているスキャナでこれらのテストチャート用紙をスキャンし、例示されたようなファイルサイズの設定を探ることで、ある程度の目安を推定することは可能だ。今後も、抽象的に示される要件に対して、このような試行をすることによって実際に使用するソフトなどの具体的な設定方法を自社内で決めるということになるかもしれない。

 このレベルを社内で定めるときには、既に述べたように、書いてある文字が読めるという観点だけではなく、改ざんを見破る経験という観点からも、検討する必要があるという点に注意すべきだろう。また、JPEGのように自然画を圧縮することについて最適化されている方式を、文字など高周波成分の多い文書の保存に使うのがよいのかどうかも、今後議論する必要があるのかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ