令和3年(2021年)度の税制改正で、電子帳簿保存法が改正されました。税金関係の書類を、電子化して保存するための条件が大幅に緩和されました(詳細は別記事「令和3年度の電子帳簿保存法 「うちは関係ない」とは言えない、2つの注意点」をご覧ください)。しかし、具体的な法対応を進めると「分からない」「判断に迷う」という声もチラホラ。本連載では、公認会計士の中田清穂氏がそうした疑問にQ&A形式でお答えします。
Q 前回のQ&Aで、着信フォルダに格納されたPDFファイルを、自分(RPA)で起動したOCR(Optical Character Recognition、光学的文字認識)で読み込んで、PDFの中に書き込まれている「日付」「金額」および「取引先」などの検索要件に関わる項目がどの部分なのかを自動判別し、文字(テキストデータ)に変換させる──という解説がありました。
日付、金額および取引先などの検索要件に関わる項目を自動判別できる高度なOCRツールがあるのであれば教えていただきたいです。
A PDFなどの画像データから、コンピュータで処理できるテキストデータに変換する仕組みとして、OCRは以前から利用されています。
このOCRは、AIの活用などもあって飛躍的に進歩しています。特に「識字率」の向上と、所定の様式にとらわれない「フリーフォーム」での利用ができるようになったことで、十分実用的な段階になったと思います。そして、このような高性能なOCRを提供する企業も複数出てきています。筆者が4つのサービスを紹介します。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング