紙とデジタルの橋渡し――OCR処理で住民サービスを向上した世田谷区導入事例

東京23区で最も人口の多い世田谷区の住民税を処理するには、120万件にものぼる関係書類の入力作業が必要だ。そして、その最大の問題は、住民税を算出するための確定申告書類や報告書などの書式やサイズがまちまちで、手入力作業が基本となっていたこと。世田谷区は、これを高精度のOCRによってイメージ処理することで、大幅なコストダウンを実現。それに付随してサービス向上をも成し遂げたという。

» 2009年12月10日 08時00分 公開
[井上健語(ジャムハウス),ITmedia]

自治体情報システムのオープン化がきっかけ

財務部課税課 事務調整係 係長 近藤明彦氏

 自治体の課税課における業務の1つに、住民税の計算と通知書の送付がある。世田谷区も例外ではないが、東京23区で最大となる人口83万0103人(平成21年1月1日現在)を抱える自治体となると、その課税計算処理だけでもおよそ120万件の書類をコンピュータに入力しなければならない。しかも、課税計算の根拠となる書類は、税務署からの確定申告書類、一般の区民税の申告書類、事業者からの給与支払報告書など多岐にわたる。

 この課税資料をイメージ化し、一部OCR処理したという背景には、自治体の情報化政策もあったと、財務部課税課 事務調整係 係長の近藤明彦氏は話す。

 「平成21年度から区役所の基幹情報システムを、従来のホスト系からオープン系のシステムに移行するという計画がありました。その中で、他区の例ですが書類をスキャナーでイメージ化しているシステムがありました。この例は、世田谷区で導入したシステムではありませんが、税務書類をイメージ化するだけではなく、OCR処理にできないかと考えました」

 世田谷区の場合、基幹情報システムのオープン化という追い風があったものの、短期間に集中する書類データの入力処理は、職員や外部スタッフを含めてかなりの作業負荷になっていた。近藤氏によれば、OCRは歴史のあるシステムだが、給与支払報告書のように同一書類なのに何パターンもあるような書類の入力をこなせるシステムが存在せず、必然的に手作業となっていたという。手作業による問題は非効率だけではない。

「多様なフォーマットでかつ膨大な量の申告書類の入力作業は外部へ委託せざるを得ないのですが、個人情報の取り扱いという観点から非常にデリケートな対応が必要となります。OCR入力による効率的な内部作業が確立できれば、そのようなデータを外部へ持ち出すリスクを減らせます」(近藤氏)

 個人情報を扱う自治体にとって、その保護対策やリスク管理はもはや常識となっている。書類のOCR処理は、単に業務の効率化だけでなく、コンプライアンスや個人情報保護といった観点からも有効性が検討されていたわけだ。

 さらに、入力を外部に委託するといっても、課税資料をそのまま渡せばよいというわけではない。この書類のどの部分を入力するか、どのように入力するかなどのマークや補足情報を、書類に書き込んで指示したり、地名の読み方やコード付けなどの下処理(この作業をコーディングと呼ぶ)をしたりする作業が必要となる。これらの作業は、委託する前に職員が行うことになる。しかも、税法や資料様式が毎年のように変わり、コーディングや委託業者への指示もその都度変更が発生する。

 以上のようなことから、課税資料のイメージ化およびOCR化システムの構築が検討された。まずは、最も件数が多く書類のパターンも多い、事業者からの給与支払報告書のOCR化のシステムが検討された。

システムの鍵やOCRの読み取り精度とトータルな入力業務の支援

 世田谷区のOCRシステムの提案依頼に対して複数のベンダーから提案があった。そのすべてのシステムを検討した課税課 事務調整係の水谷允徳氏は言う。

 「導入にあたって考えたポイントは2つあります。1つはそのシステムで何ができるのか、ということです。われわれの業務とそこで必要としている機能に対して、どんな作業をどこまでやってくれるのか、という視点で提案システムを検討しました。もう一つは、基幹情報システムの入れ換えというプロジェクトも進んでいましたから、そのシステムとの連携についても留意しました。読み込んだデータやイメージが、基幹情報システムとどのように接続できるのかの確認も行いました」

OCRによる課税データ入力 OCRによる課税データ入力と基幹情報システムの連携

 続けて水谷氏は指摘する。

 「最終的な選定ポイントは、OCRの読み取り精度の高さにもありましたが、実は、提案当初のころは、こちらの要求に対する各ベンダーの認識にズレもありました。OCR処理の部分だけでなく書類データの入力作業全般を支援してくれるシステムを望んでいたのですが、多くのベンダーはデータの読み取り部分だけの自動化を考えており、不読・誤読文字の補正処理までは考えられていませんでした。最終的に高い性能でOCRのスペック的な要求をクリアし、データ入力を包括的なソリューションとして提案してくれたベンダーに決定しました」

 導入を担当したのは東芝ソリューション。2008年2月に導入システムが内定し、4月から仕様のすり合わせや、同時進行の基幹情報システム入れ換えプロジェクトとの調整などが行われた。基幹情報システムとの連携部分を担当した課税課事務調整係の柳沼守氏はこう振り返る。

 「4月から仕様の細部の打ち合せが始まりました。実際に組み上がったOCRシステムが納入されたのは9月に入ってからです。この間、基幹情報システムの入れ換えも同時に並行して動いており、そのスケジュールとの同期をとる必要もありました。OCRシステムが納入されてからすぐに単体テストが始まりましたが、基幹情報システムとの結合は11月からの作業でした」(柳沼氏)

課税課 事務調整係 水谷允徳氏(写真=左)、課税課 事務調整係 柳沼守氏(写真=右)

 このように、開発は同時進行の基幹情報システムとの結合テスト、連携確認、業務区分の切り分けなどの要素が加わったものになった。こうした中で単体テストを始めたそうだが、読み取り精度については、スピードもさることながら、エラー率を極力下げるため、画像認識ロジックを含めあらゆる点を両者が共同してチューニングしていった。OCRのチューニングにこだわった背景には、次のような事情もあったようだ。

 「紙の伝票や課税資料のデータ化は、標準的なOCR技術からするとハードルの高いものかもしれません。ですが、多くの自治体が同じ問題を抱えており、世田谷区で実用に耐え得るシステムが構築できたら、それはほかの自治体へも展開できる可能性があります。そう考えて、あえてさまざまな要求を出していきました」(近藤氏)

入力作業の圧倒的な短縮とサービス向上という効果も

 このようにして世田谷区の課税課に導入されたOCRシステムは、2008年の業務から本格的に稼働した。本来の導入目的である給与支払報告書の入力作業とそれを委託するための下処理での時間短縮やコスト削減効果はすぐに表れたようだ。データ入力作業を外部委託するため、報告書の束を簡易製本したり、入力箇所のマーキングや振り仮名を付けたりといったコーディング作業が、OCR導入によって明らかに減ったという。

 今年度の処理は実験的に、全65万件ある給与支払報告書のうち、事前に調べた50万件についてOCR処理を行い、OCRで対応できそうにないと判断した残りについては、従来からの入力作業に分離させて運用してみた。それでも、50万件分の入力作業の外部委託費の大幅な節約が実現できた。これは、上で述べた職員による下処理作業の時間を含めると、大きな削減効果だったと言える。

 しかも実際に作業をしてみると、OCRの処理速度はテスト時の想定を上回る速さだったという。そのため、次年度は外部委託の件数をさらに減らしてOCR処理の比率を上げていく予定だ。補正処理件数が増えても、委託せずにその場で補正処理するほうが効率的ということも分かった。

 さらなる効果もあった。原本の確認や照会がイメージの検索と閲覧で済むようになったことで、問い合わせに対する返答までの待ち時間を短縮することができた。これは、直接的な住民サービスの向上という点で評価しているという。

 官公庁や自治体で進む電子政府の潮流はあるものの、全国民、住民を対象とするためユニバーサルデザイン、アクセシビリティを考慮すると、紙が残る分野においてOCR入力やイメージデータ入力という手法を用意しておく価値はしばらくあるだろう。世田谷区では、課税計算に利用している書類のOCR対応を進め、そしてこのシステムやノウハウをほかの自治体でも活用すべく、ベストプラクティスの提供・共有なども積極的に取り組んでいきたいとしている。

 OCRを利用したソリューションは、文字認識とイメージデータベースとの組み合わせにより、応用範囲が広がっているようだ。

企業向け情報を集約した「ITmedia エンタープライズ」も併せてチェック

関連キーワード

OCR | 地方自治体 | 運用管理


関連ホワイトペーパー

OCR | 運用管理 | コンプライアンス


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ