スキャン代行サービスの現状と内容比較「スキャン代行サービス」大研究(2/3 ページ)

» 2010年10月25日 08時00分 公開
[eBook USER特別取材班,ITmedia]

 スキャン代行サービスはどんな書籍にも対応しているわけではなく、例外事項も数多く存在する。以下では各業者の利用規約から、どのような書籍がスキャン代行サービスの対象となっているのかを見ていこう。なお、本稿は2010年10月16日現在の内容を基にしており、その後変更されている可能性もあることをお断りしておく。

付属物は原則としてスキャン対象外 カバーについては対応が分かれる

 BOOKSCANの規約には「書籍に挟まっているハガキ・付箋・取れる紙、表紙・背表紙・帯・カバー等はスキャンせずに廃棄処分させて頂きます」とある。要するにスキャンの対象になるのは「書籍」としての本体だけで、付属物は一切スキャンされないということだ。

 スキャン作業を行う上でこうしたイレギュラー要因を減らしたい業者の意向は十分理解できる。もしこうした付属物までスキャンするとなると、作業工数が増える上にミスが発生しやすくなり、また納品後に付属物をめぐったトラブルに発展することも考えられるからだ。

 ただし、後発の業者の中には、表紙やカバーのスキャンを別料金で請け負ったり、基本料金に含めているケースも見られる。iPad(iBooks)では表紙ページがサムネイルになることから、カバーおよび表紙なしで納品されたPDFをそのままiPadに転送してしまうと、見栄えがあまりよくない。その点からも表紙のスキャンはニーズが高いといえる。カバー対応をうたっている場合、どの程度のクオリティで仕上がってくるか、また帯や背表紙の扱いがどのようになるかは業者を選ぶ際のポイントの1つといえる。

付せんなどは申込前にはがしておく必要がある。また、書籍のカバーは、スキャンに対応しない業者もあるので注意したい

 なお、ハードカバー(硬いカバーの表紙で覆われた本、上製本とも呼ばれる)の扱いについては、規約の中で明言されていないことが多いが、例えばBOOKSCANのサイトでは、ハードカバーをカッターで切り離す写真が存在していることから、受付自体はしていることが分かる(ただしスキャンの対象になるかどうかは業者で異なる)。その一方、発送前にカッターナイフなどで取り除くよう指示している業者もあるなど、対応にかなりの差がある。

 また、折り込みのピンナップや年表、ガイドブック類を構成する地図など「書籍の本体に糊付けされた付属物の扱い」についても、明言されていないことが多い。このほか書籍の中には、表2、つまり表紙の裏側から本文がスタートしている場合があり、表紙が廃棄されてしまうと本文の一部が欠けてしまう場合がある。これらの対応についても言及されているケースはまれであり、業者によって対応が異なると考えられる。

雑誌や辞書、写真集などは多くの業者で対象外

 BOOKSCANの規約では、雑誌は受け付けていないことが明示されている。理由としては「紙が静電気でくっついてしまうため」とある。また、「タウンページ・辞書などの紙の厚さの書籍は、読込エラー発生率が高い・破れやすいため現在は対応しておりません」ともあることから、紙質がネックになっていることが分かる。多くの業者も右へ倣えで同じ規約を掲げているが、最近になって雑誌に対応する業者も登場しつつある。

ScanSnap S1500 PFUのドキュメントスキャナ「ScanSnap S1500」。センサーによる重送検知など機能は豊富だが、不得意とする紙質も少なからずある。ただし、これは本機種に限ったものではなく、ドキュメントスキャナ全体に共通する傾向だといえる

 雑誌が敬遠されるのは、ドキュメントスキャナの特性に依存するものといえる。雑誌に用いられる薄手の紙は、スキャン時に重送、つまり紙詰まりが発生する確率が高い。雑誌の種類ごとに「これはNG、あれはOK」と明示するのは非現実的なので、一括して雑誌はNGとしているのだろう。とはいえ、場所を取る週刊誌や月刊誌をデータ化したいというユーザーニーズは比較的高いと考えられるため、後発の業者が雑誌への対応を積極的にアピールすることで利用者を呼びこもうとしているのも理解できる。

 また、写真集についてもNGとしている業者が多い。これはコート紙とドキュメントスキャナの相性に依存するところが大きいと推測されるが、ハードカバーかつA4サイズを超える写真集が多いことも要因の1つだと思われる。「雑誌コードを取得していること」と明確に定義できる雑誌と違い、写真集に共通の定義は存在しないことから、各業者がどの程度融通を利かせているのかは気になるところだ。

カラーモードは「自動」がほとんど。フォーマットはPDF

 ドキュメントスキャナの読み取り時のカラーモードについては、多くの業者で「自動」であることが明言されている。カラーとグレー、および白黒といったモードの切り替えをドキュメントスキャナ側に委ねることで、手動で切り替える手間を軽減したいという狙いがあるのは言うまでもないだろう。

 ただし、ドキュメントスキャナのカラーモード判定の精度はあまり高くない。ちょっとした変色や蛍光ペンでの書き込みがあるだけで、グレーのページがカラーと判定されてしまうことは日常茶飯事だ。実際、BOOKSCANの規約でも、「本が黄ばんでいる場合も、カラーモードで読み取られる場合がございます」と明言されている。また、一部の業者では「表紙はカラー、本文はグレーモード」とうたっている場合がある。

 もちろん、誤ってカラー情報が失われてしまうリスクを考慮すると、すべてのページをカラーで読み取っておいた方がよいともいえるが、カラーだとデータ量も増えるほか、前述のように黄ばんだページがそのまま読み取られるという問題もある。明らかに白黒の本文について業者がどう対応しているかも、ポイントの1つといえる。

 なお、納品されるファイルのフォーマットは、どの業者もおおむねPDFで統一している。一部では自炊ユーザーに人気が高い「ZIP圧縮のJPEG」に対応している業者も存在する。ドキュメントスキャナの多くはPDFおよびJPEGにしか対応しないことから、BMPやPNGなどのフォーマットはまず見かけない。

回転や傾き補正の設定内容ほとんどの業者が非公開

 多くのドキュメントスキャナの回転および傾き補正については2種類ある。90度単位で文書の向きを回転させる「向き補正」と、数度単位で斜行を補正する「傾き補正」だ。

 BOOKSCANの規約では、これらの補正モードの有無について言及されていない。かろうじてOCRについて言及した箇所に「OCRの自動傾き補正処理の誤認識によりレイアウトによって傾きが発生することがあります」とあるが、OCRはオプションということもあり、そもそもこれらの補正設定がどのようになっているかは明言されていない。

ドキュメントスキャナの設定画面 ドキュメントスキャナの設定画面。「文字列の傾きを自動的に補正します」は数度単位で斜行を補正する「傾き補正」、「原稿の向きを自動的に補正します」は90度単位で文書の向きを回転させる「向き補正」だ

 画像処理ソフトを利用した経験のある方であればご存じだろうが、いったんデータ化した後の傾き補正は画質の低下につながるので、なるべく取り込み時に補正が行われるのが理想だ。その一方、斜体になったフォントを文字列自体が傾いているとみなして角度を補正する例もあり、万能ではない。あくまで元の原稿をなるべくまっすぐに読み取らせるのが大原則であるため、実際の精度は気になるところだ。

 また、書籍は一般的に縦に長いため、横に寝かせてスキャンした後、向き補正機能で90度回転させた方が、取り込みに要する時間は短くなる傾向がある。恐らく多くの業者がこの方法で取り込みを行っていると考えられるが、オートの向き補正機能ではページ内の文字列の向きを判定材料としているため、絵を中心としたページでは本来の向きに回転しないことも少なくない。これらの仕上がりはチェックを要するポイントだろう。

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー