検索
ニュース

印刷文書に手書きした“メモのみ”を抜き出し、PDF文書に挿入 ドイツの研究チームが技術開発Innovative Tech

ドイツのUniversity of Regensburgの研究チームは、印刷した文書に直接書いた注釈のみをデジタル化して抽出できるシステムを開発した。デジタル化した注釈は、元のPDF文書に重ねるように挿入できる。

Share
Tweet
LINE
Hatena

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 ドイツのUniversity of Regensburgの研究チームが開発した「Extracting Handwritten Annotations from Printed Documents Via Infrared Scanning」は、印刷した文書に直接書いた注釈のみをデジタル化して抽出できるシステムだ。デジタル化した注釈は、元のPDF文書に重ねるように挿入できる。


紙の書面で書いた注釈をPDF文書に移動させているイメージ図

 文書に注釈をつけるためのデジタルツールが豊富にあるにもかかわらず、複雑な文章の校正や注釈をつけるのに、画面よりも紙を好む人がいる。PDFをプリントアウトし、手書きでメモを取る人が案外多いという。

 直接手書きした紙の文書をスキャンすると、文書全体がデジタル化されてしまう。今回は、文書全体をデジタル化せず、手書きメモした箇所のみをデジタル化し抽出する手法を提案する。抽出したメモは、元のPDF文書に挿入することもできる。

 この手法では、市販のフラットベッドスキャナーに赤外線(IR)光源を追加し、印刷物から手書きの注釈を抽出する。RGBとIRの2回のスキャンを行うことで、IRを吸収する黒色トナーとIRを透過するカラーインクを区別する。

 簡単な画像フィルターにより、オリジナルの印刷物を含むビットマップと、全ての注釈を含むビットマップを生成する。スキャン処理後、抽出された注釈は、背景が透明なPNGファイルとして保存される。これらは、オプションでPDF文書に挿入することができる。


改造したスキャナーの模式図

(a)文書のRGBスキャン、(b)同じ文書のIRスキャン。注釈は見えない、(c)照明ムラを補正するために使用した空のIRスキャン、(d)注釈のみを抽出した処理結果、(e)抽出された注釈が元のPDF文書に挿入された状態

Source and Image Credits: Andreas Schmid, Lorenz Heckelbacher, and Raphael Wimmer. 2022. Extracting Handwritten Annotations from Printed Documents Via Infrared Scanning. In CHI Conference on Human Factors in Computing Systems Extended Abstracts (CHI EA ’22). Association for Computing Machinery, New York, NY, USA, Article 363, 1-6. https://doi.org/10.1145/3491101.3519872



Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る