AI-OCRと“相性抜群”な業務とは? ベンダー選びのポイントは「認識精度の高さ」

» 2020年02月18日 10時00分 公開
[PR/ITmedia]
PR

 ITの隆盛によってデジタル化が進む昨今においても、企業には多数の紙の書類が存在する。社内のシステム化が進んでいても、取引先との受注書や発注書などのやりとりが紙ベースなら、ペーパーレス化の実現は難しいだろう。書面に書かれた文字をPCに手入力する作業が大量に発生すると、現場も疲弊してしまう。

 そうした単純作業を効率化する技術として注目されているのが、電子化した書類データの文字を自動認識する「AI-OCR」だ。OCR(光学文字認識)技術は古くからあるものだが、近年急速に発展してきたAI技術を応用することで、非常に高い文字認識率を実現している。

 MM総研が2019年6月に実施した調査によると、日本国内の企業のうち、9.6%がAI-OCRを導入済みで、51.9%が「利用に関心がある」と答えたという。導入企業はまだ多いとはいえないが、未導入企業の関心の高さが伺える。

日本企業のAI-OCRの利用状況(MM総研より)。調査は、ホワイトカラーの業務生産性の向上を推進する日本国内の1000社を対象に、Webアンケートを実施。調査期間は2019年6月21日〜24日

 本調査で注目したいのは、導入企業がAI-OCRの効果の高さを実感していることだ。導入企業の85.7%が「データ作成に要する時間」を削減できたと回答し、次いで「ミスの発生率(の低減)」(82.1%)、「当該業務に必要な人員数(の削減)」(78.6%)、「当該業務の外注費(の抑制)」(73.2%)などにも効果があったと答えている。

AI-OCR導入の効果(MM総研より)

 「過去にOCRを使って思うような精度が出なかったという方も、AI-OCRを試してみるとイメージが変わると思います。活用のポイントをしっかり理解して取り組めば、大きな成果を得られます」と、NTT東日本の庄司哲也担当課長(ビジネス開発本部 第二部門 ビジネス企画担当)は強調する。

 NTT東日本は、認識精度96%超のAI-OCRサービス「AIよみと〜る with AI inside」(以下、AIよみと〜る)を提供し、多くの企業の導入を支援してきた実績を持つ。AI-OCRで成果を出すコツや注意点について、庄司担当課長に聞いた。

「AI-OCRの効果が出やすい業務」と成功への近道

NTT東日本の庄司哲也担当課長(ビジネス開発本部 第二部門 ビジネス企画担当)

 そもそも、企業はどういった目的でAI-OCRを導入するのだろうか。庄司担当課長は、「社員をより生産性の高い業務に集中させたいと考えている方が多いです。主に働き方改革を推進するための手段として導入されています」と話す。

 導入の際には、どの業務にAI-OCRを適用するかが重要になる。「業務選定のポイントは、紙書類のボリューム、業務の集約性、標準化の3つです。紙を減らせないという前提で、どう効率化していくかを考えないといけません」と庄司担当課長は指摘する。

 紙書類のボリュームは、ひと月当たり1000枚以上あればコスト削減などにも効果的だというが、加えて業務の内容を考慮することも重要だ。登録口座の変更など、書類が届くと同時に処理しなければならない業務なら、手作業のほうが速いこともあるだろう。一方で、確定申告など決められた時期にまとめて処理する業務なら、AI-OCRを使って一気に書類を読み込ませたほうが効率的だ。つまり、一定期間に多くの書類をまとめて処理できる業務かどうかが重要になるわけだ。

 標準化とは、書類様式や運用を統一することを指す。「書類の様式がバラバラで、運用フローが最適化できないと、思うような効果は得られません。運用フローを変えるには現場の理解を得る必要もあります」(庄司担当課長)

 例えば2枚セットの書類を処理する場合、1枚ずつAI-OCRで読み込ませると、書類同士のひも付けができなくなってしまうという。そういった際には、読み取った書類データに番号を振ったり、スキャンした書類をクリップなどでまとめたりといった運用上の工夫が求められる。

 このように、AI-OCRの効果を高めるためのコツはあるものの、「導入前に全ての課題を完璧に洗い出して、どの業務に適用するかを決めることは、実は難しいんです」と庄司担当課長は話す。

 「新しいツールを試すときは何でもそうですが、試してみないと分からないことは非常に多いです。まずはスモールスタートでやってみることをお勧めしたいです」

ベンダー選びで「認識精度の高さ」に注目すべき理由

 実際にAI-OCR導入を決める際には、ベンダー選びも重要になってくる。選定のポイントはいくつかあるが、業務効率化に直結する認識精度は外せないだろう。

 AI-OCRは、紙書類の文字を100%認識できる技術ではない。認識できなかった箇所は、人間が目視して修正する必要があるため、認識精度が高いほど、人間がフォローする手間が省けるということだ。

 先述したMM総研の調査では、国内の主要なAI-OCRサービスの手書き文字認識率を比較している。検証には、手書き文字のデータを使用。故意に紙面の角度を変えたり、紙面を汚したりした“ゆがみデータ”でも試したという。結果、NTT東日本のAIよみと〜るが「96.4%」と最も高い数字で、他のサービスは次点でも「92.9%」にとどまっている。AIよみと〜るは、ゆがみデータでも認識精度がほとんど落ちないという特徴も見られた。

 認識精度を実現できる理由について、庄司担当課長は「AIよみと〜るで活用しているAI inside株式会社が開発したAI技術は、開発当初から膨大なデータを学習しています。導入企業が多いため、学習データが集まって精度がどんどん上がっていくんです」と説明する。

国内主要サービスの手書き文字認識率の比較(MM総研より)

 次に注目すべきは、ツールの操作性だ。これは、人間が手作業でフォローする「残り数%」の部分をいかに効率化するかに関係してくる。

 MM総研は、AI-OCRによる文字認識と人間による修正作業を合計した作業時間の検証も行った。具体的には、手書きで必要事項を記入した3種類の帳票を100枚ずつ用意し、PDFのデータを作成。そのうち、30枚はゆがみデータを使用した。そこでも、AIよみと〜るは「3時間40分45秒」と最も良い結果だった。他のサービスは「4時間1分6秒」「11時間41分25秒」となっており、大きく差がついている。

国内主要サービスの作業時間の比較(MM総研より)

 AIよみと〜るは、ブラウザベースで直感的に操作できるユーザーインタフェース(UI)を採用している。読み取り範囲や修正箇所の指定はマウスクリックで済み、あとは該当箇所をタイピングして修正すればいい。素早い修正作業を可能にしたことが、作業時間の短縮につながっているのだろう。

 最後に挙げたいのが、ベンダーのサポート体制だ。初めてAI-OCRを導入企業はもちろん、いまいち効果を実感できていない企業にとっても、ノウハウを持つベンダーは心強い存在になる。

 その点について、庄司担当課長は「NTT東日本では全国規模のサポート体制があり、技術的な質問にもお答えできます。お客さまが自走できるように、業務ヒアリングから使い方のポイント、運用面まで手厚くサポートできるのが強みです」と自信を見せる。

 AIよみと〜るは年額制のSaaSだが、PoC(概念実証)をしたい企業向けに2カ月の有料プランを用意している。PoC期間中は、オンサイトで業務ヒアリングやツールの操作説明などをしてくれる「サポートプログラム」を無償で提供。導入後すぐに社内展開できるよう支援する。

 2カ月という短期間で効果を実感してもらうには、初動が大切だからだ。庄司担当課長によると、導入前に行う現場向けの製品説明会で活発に意見が交わされる企業は、軌道に乗りやすい傾向にあるという。

 「AI-OCR導入には、現場の協力が不可欠です。説明会で現場の方から『あの作業に使えそうだ』『この業務はどうだろう』とアイデアがたくさん出てくるような企業は、導入もスムーズで効果もきちんと出ます。活用方法を自ら考え、試し、実践できるような利用イメージを持ってもらうことが大事です」

 自走できた企業からは、設定方法や認識精度を上げるコツなどテクニカルな質問が増えるという。NTT東日本では、エンドユーザー(社員)からの問い合わせを受け付ける窓口を用意し、必要に応じてシステムにリモートログインして設定などをサポートする。「細かな設定も任せたい」「RPAとの連携も行いたい」というニーズには、訪問サポートやRPAのbot作成支援なども行う。

 「今後は、多様な業務や業態で活用しやすいプランの拡充も計画しており、幅広いユーザーに活用してもらいたいと考えています」

Copyright © ITmedia, Inc. All Rights Reserved.


提供:東日本電信電話株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2020年3月3日

関連リンク