かすれた原稿の認識精度が向上――「読んde!!ココ」最新版

セイコーエプソンのOCRソフト「読んde!!ココ」の新バージョンでは、「かすれ領域抽出機能」によって認識精度が改善した。「OCRファクトリー」でファイル登録までの手順を自動化も可能だ。

» 2007年01月22日 18時22分 公開
[吉田有子,ITmedia]

 セイコーエプソンは、OCRソフト「読んde!!ココ」の新バージョンVer.13を2月23日に発売する。価格は2万790円で、Windows Vista/XPに対応する。

読んde!!ココ Ver.13

新機能「かすれ領域抽出機能」を搭載

 最新版では、OCRの基本部分となる認識精度の向上を図った。新機能として、「かすれ領域抽出機能」を搭載。この機能は原稿をぼかして認識することで、何度もコピーしたり、FAXで受信した原稿の罫線のかすれを低減し、罫線が多い原稿のレイアウト解析精度を高めるものだ。

 かすれ領域抽出機能は「弱」「中」「強」の3段階から選べる。かすれた原稿の読み取りがうまくいかない場合には、まず「弱」から順番に強度を上げて使う。原稿をぼかしても、文字はぼかさずに取り込むが、まれに文字領域を画像領域として認識してしまう“副作用”もある。ただし、全体としては「この機能によって4%程度、認識精度が改善した」(同社)という。

読んde!!ココ Ver.13のかすれ領域抽出機能

 このほかの新機能では、「白紙除去機能」を搭載。読み取った画像のうち白紙のページを自動的に消去するため、大量の紙文書のうち無駄なページを電子化せずに済む――というわけだ。また、スキャン時のゴミ画像を除去する「ノイズ除去機能」は前バージョンよりも精度を高め、カラー原稿にも新たに対応した。

保存できるファイル名のパターンを追加

 従来通り「OCRファクトリー」を利用すると、紙文書のスキャンからデータ保存までの手順を複数登録して処理を自動化できる。今回のバージョンアップでは、ファイル名の保存パターンを追加した。 これまでは「指定した連番」「元画像のファイル名」「認識結果のファイル名」で保存が可能だったが、新しく「続きからの連番」「処理時刻の付加」「ユーザーが定義したファイル名」でも保存できるようになった。

「OCRファクトリー」メイン画面(左)と設定画面
OCRファクトリーで処理時刻を付加(左)とユーザーが定義したファイル名で保存

 さらに、ファイル管理ソフト「Document Storage」やWeb情報共有ソフト「Document Browser」を利用すると、1回の操作で文書の電子化からこれらのソフトへのファイル登録までが完了する。

ドキュメントストレージ

 読んde!!ココ Ver.13のダウンロード版は1万3440円。アップグレード版はパッケージ版が7875円、ダウンロード版が5040円。また、Document Storageとのセット「読んde!!ココ Ver.13 Document Storage Suite」は2万3940円、こちらのアップグレード版は1万3440円。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ