フレッシュサマリ

申込書や本人確認書類の入力/チェックで困っている? 「Kodakドキュメントスキャナ」と「ABBYY Flexicapture」を組み合わせたキャスティングロードのソリューションで解決!

» 2023年06月29日 10時00分 公開
[PR/ITmedia]
PR

 顧客から届く「申込書」や「本人確認書類」といった書類をデジタルデータとして取り込む際に、手入力をすると時間がかかったり、入力ミスが生じたりしてしまう。省力化を狙って「ドキュメントスキャナ」と「OCRソフトウェア」を導入したものの、想定通りの精度とならず、結局再入力やチェックに手間取ってしまうという話もよく聞く。

 紙の書類のデータ化を高い精度で行いたい――そんなニーズに応えるのが、コダックアラリス(Kodak)のドキュメントスキャナと、高品質なOCRソフトを組み合わせたソリューションだ。今回は、同社製スキャナとABBYY(アビー)のOCRソフト「Flexicapture」を組み合わせた、キャスティングロードが提供するソリューションを紹介する。

組み合わせ コダックアラリスのドキュメントスキャナとABBYYジャパンのFlexicaptureを組み合わせて、より快適な書類の電子化を実現しよう!

そもそも、なぜ書類の読み取りがうまく行かないのか?

 ドキュメントスキャナとOCRソフトを組み合わせた書類のデータ化や自動入力がうまく行かない場合、スキャナとソフトの両方に原因がある可能性がある。

ドキュメントスキャナ側の原因

 OCRソフトは、ドキュメントスキャナが読み取りデジタル画像化した書類から文字を起こしたり、データを自動入力したりする。そのため、スキャナが書類を読み取って生成するデジタル画像の画質が、文字起こしやデータ入力の精度を大きく左右する。

 しかし、受け取る書類は折り目が付いていたり、シワが寄っていたり、微妙な汚れが付いていたり……と、全てが“均質”とは限らない。折り目やシワ、汚れを“そのまま”出力してしまうスキャナを使うと、OCRソフトは正しく文字やデータを認識できないことが増えてしまう。ゆえに、手動での入力補正や人手をかけて「ダブルチェック」や「トリプルチェック」をせざるを得なくなり、手間を減らすどころか増やしてしまうこともある。

 読み取りの精度を高めるためにも、均質ではない書類を、一定水準以上の品質で安定してデータ化できるスキャナが求められる。

OCRソフト側の原因

 一言で「OCRソフト」といっても、さまざまなものがある。「定型書類に強い」「手書き文字に強い」「チェックマーク(マークシート)の読み取りに強い」「いろいろな言語の読み取りに強い」など、得意とする書類や分野はソフトによっていろいろだ。

 例えば、いろいろな種類の書類を読み取る場合は、非定型書類の読み取りに強いOCRソフトを使うべきである。しかし、読み取る書類とOCRソフトの“相性”が合わず、想定通りのパフォーマンスを発揮できないという事例もよく聞く。

 ドキュメントスキャナの性能はもちろんだが、読み取る書類(用途)に合わせたOCRソフトを使うことも重要だ。

「Kodakスキャナ」×「ABBYYのOCRソフト」のメリットは?

 一定以上の品質で安定して書類データを出力できるドキュメントスキャナと、読み取る書類に合わせたOCRソフトを用意する――言うのは簡単だが、実際に最適な組み合わせをユーザー側が探るのは難しい。

 そこで検討したいのが、ドキュメントスキャナとOCRソフトを“組み合わせて”ソリューションとして提供するサービスだ。冒頭で書いた通り、キャスティングロードはKodakドキュメントスキャナとABBYYジャパンのFlexicaptureを組み合わせたソリューションを提供している。それぞれの特徴を紹介しよう。

スキャンデータの品質に定評のあるKodakのスキャナ

 Kodak業務用ドキュメントスキャナは、1台で多種多様な書類に対応可能な構造を備えている。また、とじ込まれていない紙書類であれば、エレベーター給紙によって自動的に読み取りを進められるので、書類の読み取りに掛かる手間を減らせる。

 さらに、独自技術「パーフェクトページテクノロジー」によって汚れやしわのある書類もノイズなく高品質にデータ化できるので、データのチェックや修正にかける時間を削減可能で、OCRソフトのポテンシャルを一層引き出せる。

 詳細なラインアップは、過去の記事を参照してほしい。

非定型書類の読み取りに強いFlexicapture

 ABBYYのFlexicaptureは、その名の通り柔軟にさまざまな書類を読み取れることが強みで、国内外で5000を超える企業が採用している。多言語対応にも強みがあり、認識できる言語は実に220にも上る。

 柔軟な読み取りは、多くの機能によって支えられている。主な機能を上げると以下の通りである。

  • 相対位置での情報取得
    • あらかじめ指定したキーワードを書類上で発見すると、そこからの相対位置によって必要な(取得したい)データを特定可能
  • さまざまな検索キーワードに対応
    • 複数のキーワードを「同義」として登録しておけば、様式が異なる書類でも必要なデータを特定可能
  • 文字列“ではない”要素を使ったデータ抽出が可能
    • 文字が細かすぎてキーワードを取得(認識)できない場合は、「けい線」「空白領域」「バーコード」をキーワード代わりにして必要なデータを捜索できる
  • データベースから入力データ「補正」可能
    • 文字つぶれで読めないデータがある場合は、事前にデータベースを用意しておくことで、読み取れる他の要素を参考にしてデータを補正できる
  • 複数ページに渡る明細も正確に入力可能
    • アセンブリ機能を活用することでデータを簡単に「ページ順」でソートできる
  • 複数行や仕切りが複雑な明細表も正確に読み取れる
  • AI(人工知能)を活用した仕分け
    • AIで読み取った書類を自動分類可能
    • 画像だけではなくテキストも自動分類可能
    • 手動で分類のチューンアップ可能
    • 「見た目が似ている異なる書類」は、グルーピング機能をうまく使って仕分け可能
  • AIを活用したイメージの補正
    • 地紋や印影を検知し、これらを除去した画像を保存可能
    • 向きが異なる画像が混じっている場合は、自動的に補正して保存可能
    • 縮尺や解像度が異なるデータでも柔軟に対応可能
  • 入力補助ツールとしての利用も可能
    • OCRする範囲をワンクリックで類推し、認識結果をそのまま入力可能

 一般的な業務用OCRソフトと比べると多機能で、ユーザーによるカスタマイズにも可能なので、スキャナで取り扱う(保存する)書類の種類が多い場合に最適なソフトといえる。

詳細はキャスティングロードに問い合わせを!

 今回紹介したKodakドキュメントスキャナとABBYのFlexicaptureについて、詳細を知りたい人はキャスティングロードのWebサイトをチェックしてみてほしい。OCRソリューションを導入する上で参考になる資料をダウンロードできる他、導入検討に当たっての疑問を解消できる問い合わせフォームも用意されている。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:Kodak Alaris Japan株式会社
アイティメディア営業企画/制作:ITmedia PC USER 編集部/掲載内容有効期限:2023年7月21日

アクセストップ10

2024年09月19日 更新
  1. 「iPhone 16」がiPhone新時代の幕を開く 試して分かった大きな違い (2024年09月18日)
  2. 試して分かった10周年モデル「Apple Watch Series 10」 消えない秒針と見やすくなったディスプレイ、新たな健康機能が魅力 (2024年09月17日)
  3. 新型Ryzen AI搭載の「ProArt PX13」はデスクトップPCの置き換えも可能なモバイルPCなのか? 試して分かった夢と現実 (2024年09月18日)
  4. 「Microsoft 365 Copilot」に再度名称変更! 「Copilot Pages」「Copilot agents」など仕事で役立つ機能が利用可能に (2024年09月17日)
  5. Amazon傘下の「eero」がメッシュWi-Fiシステムを日本で販売 スマートホームハブとしても使える3モデルを一斉発売 (2024年09月18日)
  6. 「約12万円のPS5 ProよりゲーミングPCを買った方がいい」は本当なのか? 同等スペックで組んだら価格は…… (2024年09月19日)
  7. 完全ワイヤレスイヤフォンはここまで来た! フラッグシップモデル「JBL TOUR PRO 3」を試す (2024年09月19日)
  8. 「AirPods 4」はより小さく、より多機能に! 「AirPods Pro 2」は数億人の生活の質を変えうるデバイスに 林信行氏が速攻レビュー (2024年09月16日)
  9. ハンダ付けして作る「MSX DIY」構想が明らかに 西和彦氏が「MSX DEVCON 7」で語った新世代MSXの最新状況 (2024年09月16日)
  10. Apple、iPhoneミラーリング機能などを搭載した「macOS Sequoia」を提供開始 (2024年09月17日)
最新トピックスPR

過去記事カレンダー