ニュース
» 2004年11月24日 09時29分 公開

認識技術の進歩で拡大するOCR市場

e-文書法の施行などによりニーズの拡大が見込まれるOCR市場だが、応用範囲は着実に拡大している。認識速度や精度の向上に加え、従来は対応できなかった帳票も認識できるようになっており、さまざまな業種や業務に適合したデータエントリシステムとして、OCRは改めて評価されている。

[怒賀新也,ITmedia]

OCRの新用途を開拓

 OCRといえば、専用用紙にいわゆるOCR文字といわれる独自の文字を書き込み、それを読み取るというのが一般的だった。認識精度を上げるためには、ユーザーがさまざまな制約を受けながら文字を記入する必要があったのだ。

 しかし現在は、複雑な罫線フォーマットの帳票に書き込まれた文字も認識できるようになっている。これによってOCRの市場は格段に広がった。契機になったのが、医療事務には欠かせない診療報酬明細書(レセプト)の読み取りだった。

 日本の健康保険制度の下では、医療機関は患者を診療した後、社会保険の支払基金と国保連合会にレセプトと呼ばれる請求書を提出し、保険金の支払いを請求することになっている。医療機関にとってレセプト作成は必須の事務処理であり、そのデータをコンピュータに入力する作業量は膨大だった。そこで東芝ソリューションは、OCRを使ってレセプト処理に関わる医療事務を効率化できないかと考えたという。

 しかし、レセプトの様式は法律で決まっているものの、用紙そのものは各医療機関がプリントアウトするため、プリンタによっては印刷した紙に印字される座標位置が微妙にズレることがある。また、患者の症状名の欄が長くなっていたりといったズレも出てくる。病院ごとに、レセプト用紙の罫線欄の幅や長さが異なってしまうため、OCRでの読み取りを妨げていたわけだ。

 そこで同社は、座標位置ではなく、罫線の情報をOCR側が把握し、罫線枠内の文字を認識する「自動帳票フォーマット技術」を開発した。罫線の情報を読み込み、その情報に基づいて処理をするため、OCRで認識するエリアの幅や長さが変わっても、罫線情報さえ抽出できれば文字を認識できる。それにより、レセプトのように複雑な罫線フォーマットの帳票でも、OCRが読み取り領域を自動抽出して読み取ることができるようになった。

 レセプトをOCRで読み取ろうという取り組みが、OCRの新たな用途を開拓し、市場を拡大する結果となったと言える。レセプトのほかにも、フォーマットが各社で異なる会社の給与支払い明細書(源泉徴収)や、複雑な罫線フォーマットである自動車損害賠償責任保険の申込書なども、同社は「今はOCRで読み取りができる」としている。

導入してすぐに稼働できる

 このように、OCRの適用範囲が拡大した背景には同社の取り組みがある。同社のOCRシステムである2000iシリーズでは、ビジネスで利用頻度の高い帳票類にいち早く対応している。また、ユーザー自身で帳票を読み取るための設定を、簡単に行うことができるツールを用意している。

レセプトの罫線の長さなどを右側のボックスで設定できる

 具体的には、PCの画面上で帳票のイメージを表示させ、読みたいエリアをマウスで指定する。そして、その欄の何ケタをOCRに読ませるかなど、条件を指定することで作業が完了する。操作画面の設定はVisual Basicのプログラムで自由に作成できる。さらにはVB Scriptを使って、Aという読み取りエリアとBの読み取りエリアの数字を突き合わせて計算し、その結果をC欄の数値とチェックするといった使い方も可能だ。

 だが、ユーザーは読み取りにおいてさまざまな設定を利用できるものの、業種別、業務別で必要とされる帳票は多種多様だ。そこで東芝ソリューションは、ユーザーにOCRシステムを提案する段階で、帳票を読み取るための設定を請け負うサービスも行っている。これは、さまざまな業種や業務においてソリューションを構築してきた実績を持つ同社ならではのサービスだ。

 さらに、帳票や読み取り画面の作成の教育サービスも提供されており、それを活用して導入後にユーザーが独自にシステムを開発するケースもある。頻繁に運用する帳票が変わるユーザーにはこのタイプが適している。

帳票識別機能でデータエントリ業務を効率化

 同社は、提案から稼働、そして運用までの全工程をソリューションとして提供する総合力を強みとしている。OCRの活用シーンは業種ごとに異なるため、金融から自治体、流通、医療など、業種別のノウハウを持った技術者を抱えていることが、競争力の底上げにつながっていると言っていい。

 OCRの主なユーザーとして挙げられるのは、銀行、生損保などの金融機関だ。銀行では、顧客から受け取った電気、水道、ガスなど公金伝票をシステムに入力しなくてはならない。さらに、銀行には地域や伝票種類ごとに帳票を仕訳する業務があるため、OCRの活躍の場は広い。

 そこで、2000iシリーズが提供しているのが帳票識別機能だ。たとえば、複数の伝票のヘッダ部分を読み込み、「○○市 ガス」といったタイトルなどを抽出し、自動で帳票を識別できる。こうした機能により、帳票の事前仕訳にかかる作業負担が減り、データエントリ業務を大幅に効率化できるわけだ。

複数のフォーマットの帳票を自動的に仕訳する

 こうした機能は、官庁や自治体でも活用されていくことが考えられる。これまで紙として保存義務のあった文書もデジタル化して保存できるようになる。官庁、自治体にはこうした文書が非常に多い。これらの文書も、帳票識別機能を活用してレイアウトや宛先などを識別し、検索しやすく仕訳、保存することが可能となる。

 こうした活用方法は、官庁、自治体などが先導する形になると同社は見ている。それによって、企業ユーザーにまで活用が広がってくるという普及パターンになる。

ユーザーニーズに合わせた製品開発

 前回紹介したように、同社が現在提供しているOCR製品2000iシリーズは4機種。卓上型の3機種と、ソータ機能付きのモデル7000がある。機種によって認識速度が異なるという。

 同社は、独自の技術により認識精度を進化させてきた。特に手書き数字の読み取りにおいては、誤読やリジェクト率(用紙の破損や記入時の汚れで起こる読み取りエラー)を大幅に低減し、クセ字も正確に読み取れるという。

 さらに、漢字の氏名・住所の読み取りでは、OCRで認識した結果と、あらかじめ用意された単語データベースをマッチングさせることで、文字の誤用を回避させることができる。

不正確な文字はカラー表示される

 2000iシリーズのうち、最上位モデルがソータ付きのモデル7000だ。公金伝票処理をはじめ、さまざまな種類の文書を大量に扱う銀行などにおける利用を想定し、1連:10ポケットソータを最大で5連接続することができ、50種類の文書の振り分けができる。

 一方で、FAX OCRもユニークな製品として注目される。これは、FAXに送られてきた受信画像をサーバ上で取り込み、サーバ上のOCR機能で文字を認識するもの。

 一般に、スーパーや小売店からの注文書はFAXで送られてくることが多く、それらを自動処理できる。また、携帯電話の代理店などが、ユーザーの申込書をFAXでセンターに送るといったケースでも利用される。センター側の担当者は改めてユーザー情報をコンピュータに手で入力する作業をしなくても済むようになるわけだ。

 着実な技術進歩で適用範囲を拡大するOCR。今後もその動向に注目が集まる。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ