顧客から届く「申込書」や「本人確認書類」といった書類をデジタルデータとして取り込む際に、手入力をすると時間がかかったり、入力ミスが生じたりしてしまう。省力化を狙って「ドキュメントスキャナ」と「OCRソフトウェア」を導入したものの、想定通りの精度とならず、結局再入力やチェックに手間取ってしまうという話もよく聞く。
紙の書類のデータ化を高い精度で行いたい――そんなニーズに応えるのが、コダックアラリス(Kodak)のドキュメントスキャナと、高品質なOCRソフトを組み合わせたソリューションだ。今回は、同社製スキャナとABBYY(アビー)のOCRソフト「Flexicapture」を組み合わせた、キャスティングロードが提供するソリューションを紹介する。
ドキュメントスキャナとOCRソフトを組み合わせた書類のデータ化や自動入力がうまく行かない場合、スキャナとソフトの両方に原因がある可能性がある。
OCRソフトは、ドキュメントスキャナが読み取りデジタル画像化した書類から文字を起こしたり、データを自動入力したりする。そのため、スキャナが書類を読み取って生成するデジタル画像の画質が、文字起こしやデータ入力の精度を大きく左右する。
しかし、受け取る書類は折り目が付いていたり、シワが寄っていたり、微妙な汚れが付いていたり……と、全てが“均質”とは限らない。折り目やシワ、汚れを“そのまま”出力してしまうスキャナを使うと、OCRソフトは正しく文字やデータを認識できないことが増えてしまう。ゆえに、手動での入力補正や人手をかけて「ダブルチェック」や「トリプルチェック」をせざるを得なくなり、手間を減らすどころか増やしてしまうこともある。
読み取りの精度を高めるためにも、均質ではない書類を、一定水準以上の品質で安定してデータ化できるスキャナが求められる。
一言で「OCRソフト」といっても、さまざまなものがある。「定型書類に強い」「手書き文字に強い」「チェックマーク(マークシート)の読み取りに強い」「いろいろな言語の読み取りに強い」など、得意とする書類や分野はソフトによっていろいろだ。
例えば、いろいろな種類の書類を読み取る場合は、非定型書類の読み取りに強いOCRソフトを使うべきである。しかし、読み取る書類とOCRソフトの“相性”が合わず、想定通りのパフォーマンスを発揮できないという事例もよく聞く。
ドキュメントスキャナの性能はもちろんだが、読み取る書類(用途)に合わせたOCRソフトを使うことも重要だ。
一定以上の品質で安定して書類データを出力できるドキュメントスキャナと、読み取る書類に合わせたOCRソフトを用意する――言うのは簡単だが、実際に最適な組み合わせをユーザー側が探るのは難しい。
そこで検討したいのが、ドキュメントスキャナとOCRソフトを“組み合わせて”ソリューションとして提供するサービスだ。冒頭で書いた通り、キャスティングロードはKodakドキュメントスキャナとABBYYジャパンのFlexicaptureを組み合わせたソリューションを提供している。それぞれの特徴を紹介しよう。
Kodak業務用ドキュメントスキャナは、1台で多種多様な書類に対応可能な構造を備えている。また、とじ込まれていない紙書類であれば、エレベーター給紙によって自動的に読み取りを進められるので、書類の読み取りに掛かる手間を減らせる。
さらに、独自技術「パーフェクトページテクノロジー」によって汚れやしわのある書類もノイズなく高品質にデータ化できるので、データのチェックや修正にかける時間を削減可能で、OCRソフトのポテンシャルを一層引き出せる。
詳細なラインアップは、過去の記事を参照してほしい。
ABBYYのFlexicaptureは、その名の通り柔軟にさまざまな書類を読み取れることが強みで、国内外で5000を超える企業が採用している。多言語対応にも強みがあり、認識できる言語は実に220にも上る。
柔軟な読み取りは、多くの機能によって支えられている。主な機能を上げると以下の通りである。
一般的な業務用OCRソフトと比べると多機能で、ユーザーによるカスタマイズにも可能なので、スキャナで取り扱う(保存する)書類の種類が多い場合に最適なソフトといえる。
今回紹介したKodakドキュメントスキャナとABBYのFlexicaptureについて、詳細を知りたい人はキャスティングロードのWebサイトをチェックしてみてほしい。OCRソリューションを導入する上で参考になる資料をダウンロードできる他、導入検討に当たっての疑問を解消できる問い合わせフォームも用意されている。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:Kodak Alaris Japan株式会社
アイティメディア営業企画/制作:ITmedia PC USER 編集部/掲載内容有効期限:2023年7月21日