需要拡大するOCR市場と東芝ソリューションの戦略

コンピュータ・システムというと、どうしても中央のCPUの処理性能に注目が集まりがちだが、実はその前工程となるデータ入力もきわめて重要なフェーズである。このデータ入力を機械化し効率化するのがOCR。そのOCR市場が今、活気づいてきた。

» 2004年11月16日 11時17分 公開
[怒賀新也,ITmedia]

 今、OCR(Optical Character Reader=光学式文字読取装置)に改めて注目が集まっている。コンピュータのデータエントリ・システム(入力装置)として誕生し、それ以降30年にもわたる長い歴史を持つ製品だが、ここに来てまた文書入力へのニーズが高まっているのだ。

OCRの需要拡大を後押しするe-文書法

 その背景として考えられるのは、われわれの社会生活を取り巻く情報そのものが急激に増大していることだ。パソコンとインターネットの普及によって、コンピュータで扱う情報は日増しに拡大している。従来は紙媒体で保存していた情報が、コンピュータシステムのデータとしてデジタル化される機会が増えているのだ。

 国内で、こうした動きに拍車をかけているのが、2005年4月に施行される「e-文書法」である。これは、政府の基本的なIT政策である「e-Japan」に基づいて提言された「e-文書イニシアチブ」によって、関連する法律の文書の取り扱いが定められるというもの。要約すれば、以下のようになる。

 「法令により民間に保存が義務づけられている財務関係書類、税務関係書類等の文書・帳票のうち、電子的な保存が認められていないものについて、原則としてこれらの文書・帳票の電子保存が可能となるようにすることを、統一的な法律の制定等により行う」

 つまり「従来は原本を紙としていた文書についても、一定の技術水準を満たすものであれば、電子データとして取り込んだものを原本と見なす」ということである。

 このe-文書法に関連する法律は、250にも達するという。つまり、法律によって現在は紙媒体として保存義務のあった数多くの文書が、来年からはイメージデータとして取り込むことが法律的に認められるということだ。それによって企業や自治体側は、いままで倉庫を占有していた紙媒体の資料をそのまま電子化し、検索や複製などで効率的な運用が可能になる。

 このe-文書法の施行によって、膨大な紙媒体の文書類の電子化が進むことは確実であり、イメージスキャナとともに、紙に記載された文字データを電子化するOCRに注目が集まっている。

先駆メーカーであり市場のけん引役

 このOCR市場をリードするのは、東芝を前身とし、長い間OCR製品を開発し提供し続けている東芝ソリューションだ。同社プラットフォームソリューション事業部参事の原島裕之氏、同主任の前山誠氏への取材を通じて、OCRがユーザー企業に何を提供するのかを調べてみた。

原島氏(左)とOCR帳票を手にする前山氏

 OCRが最初に社会的に認知されたのは、なんといっても郵便物自動区分機の導入だ。今では当たり前になったが、郵便物に記入された手書きの郵便番号をOCRが読み込み、配達地域ごとに振り分けるというシステムだ。これによって、郵便事業が大幅に効率化される一方、手書き文字をコンピュータが認識するOCRが一般の人にも身近になったのである。

 東芝ソリューションは、この技術を一般用に応用した国内初のOCRメーカーであり、今日に至るまで約30年間、一貫してOCR製品を提供し続けている。

 当初、製品として投入したのはVシリーズと呼ばれる製品群で、伝票入力からイメージ入力、テキスト入力、ドキュメント入力とその入力データの適用範囲を拡大してきた。

 その間、もちろん次々と機能強化を果たしている。レイアウト理解、自由手書き文字認識、カラーイメージ処理、図形認識など新たな商品につながる機能を拡大し、一方でOCRとしてもっとも重要な認識精度や認識速度の向上も実現してきた。

 いまさらいうまでもないことであるが、OCRは手書き文字や印字された文字を光学的に読み取り、システム自身が備えている辞書と照合することによりその文字を特定、それによって文字データをコンピュータに入力する装置である。つまり、認識精度を向上させてきた背景には、こうしたOCR自身の辞書の拡充も含まれる。このあたりには、東芝グループのITソリューション分野が持つ日本語処理技術も生きている。

OCRソリューションを支える3つの力

 東芝ソリューションのOCR事業の特徴は「技術力」「実績・ノウハウ」「総合力」という3つの言葉で表すことができる。この3つの力が同社のOCRを支えている。

 まず、「技術力」ということでは、後述するように「正しく、かつ、高速に読み取る」ための認識技術やスキャナ技術が特筆できる。また、OCRを操作するヒューマンインターフェース技術や、他のシステム、製品につながるネットワーク技術も特徴だ。

 「実績・ノウハウ」ということで言えば、すでにふれたような過去30年にわたる実績がある。同社はこの30年間、とぎれることなく、一貫してOCR事業に取り組んできた。これは競合他社に比べても同社の大きなアドバンテージとなる。またそれが、同社の運用ノウハウにつながっている。

 OCRといっても、業種業務ごとに活用シーンでのさまざまなノウハウが求められる。たとえば、自治体には自治体の、流通業には流通業の、そして金融・保険業には金融・保険業の帳票があり、その処理の流れがある。そうした業種業務別に導入、運用するノウハウが蓄積されているというのが、東芝ソリューションの強みだ。同社はOCRのノウハウをもったエンジニアを数多く抱えており、こうした人材による手厚いサポート体制が整備されている。これが、顧客のニーズや課題を吸い上げ、的確な提案、きめ細かい対応を進めている。

 そして「総合力」として上げられるのは、東芝グループの多様な製品群との融合である。OCRを企業情報システムの一部として安定稼働させるためには、きちんとしたシステム基盤が必要になる。同グループは情報システムを丸ごと提供する「総合力」を持つ強みがある。また、OCRの中核技術である日本語処理技術を応用した商品群も自社提供している。具体的には、情報を蓄積、共有、分析するためのナレッジマネジメント支援システム「KnowledgeMeister」や、英日/日英翻訳ソフトウェア「The翻訳シリーズ」などだ。こうした文書管理に関わる製品も総合的に提供できるというのが同社の強みだ。

あらゆるOCR化ニーズに対応

 しかし、OCRとして最も重要な機能は認識精度と認識速度である。入力にあたり、ユーザーは何よりも効率化を求めるわけで、紙文書を正しく、そして速く電子データに変換する、というのがポイントになる。

 また特に、e-文書法ではスキャナによる処理・保管が認められるということになるため、その文書をいかに鮮明に入力できるかが大きなポイントになる。こうした画像処理の技術においても、同社にはアドバンテージがある。

 現在、東芝ソリューションは、スキャナOCR製品としてはスキャナの性能と機能が異なる2000iシリーズ4機種を提供している。卓上型ではエントリークラスのモデル50、ミッドレンジのモデル120、そしてハイエンドのモデル3000の3機種。読み取り速度は、それぞれ1分あたり50枚、120枚、160枚である。さらにソータ機能付きOCRとしてモデル7000がある。これらの製品はすべて同じ認識ソフトウェアで稼働する。

 また、相手先ファクシミリを入力媒体とするFAX-OCR製品としては「FAXステーション」、新聞、雑誌の記事などをデータ化する文書OCRとして「ExpressReaderPro」がある。これらの多様な製品群によって、あらゆるOCR化ニーズに対応できるというのが同社OCR事業の特徴である。

 さらに、文字認識では、従来からOCR帳票に書かれた通常の手書き文字認識のほかに、非OCR帳票の読み取りも可能となっている。複雑な罫線フォーマットの帳票でも、文字の読み取り領域を自動検出し高精度に読み取るという機能だ。これによって、たとえば診療報酬明細書(レセプト)の活字文字を的確、高速に読み取ることができるようになっている。

診療報酬明細書の読み取りも正確に行うことができる。

 こうしたOCRの応用分野については、次回に各製品の機能とともに詳しく紹介する。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ