ITmedia NEWS > AI+ >
ニュース
» 2020年12月01日 10時58分 公開

名刺上のメールアドレスを99.7%の精度で認識 Sansanが独自OCR技術を開発

Sansanが、名刺上の文字データの認識に特化した独自のOCR技術を新たに開発した。名刺上のメールアドレスの読み取り精度は99.7%に上るという。

[笹田仁,ITmedia]

 名刺管理サービスを手掛けるSansanはこのほど、名刺上の文字データの認識に特化した独自のOCR技術「DSOC OCR」を新たに開発したと発表した。名刺に記してある氏名とメールアドレスに対応しており、メールアドレスの読み取り精度は99.7%に上るという。名刺一枚当たりの処理時間は0.3秒。

photo DSOCのWebサイト

 Sansanのデータ統括部門であるDSOCが開発した。同社は、ユーザーがスキャナーやスマートフォンで撮影した名刺の画像から、氏名などの情報をOCRでデータ化するサービスを提供している。従来利用していたOCRでは、名刺を撮影した画像の画質によって精度が上下していたが、DSOC OCRでは、画像の撮影環境や名刺の形を問わず、99.7%の精度でメールアドレスをデータ化できるという。

photo

 同社によると、既存のOCR単体では高精度のデータを提供できないため、これまではOCRによる認識結果を人間の手入力で訂正していたという。すぐに名刺データが欲しいというユーザーには、OCRによる認識結果を「一次納品」として提供し、その後に人間による訂正を加えた「二次納品」を提供してきた。

 Sansanは、今回開発したDSOC OCRを利用すれば一次納品データの精度が上がるとしている。人間の手入力による訂正も減るため、二次納品までの時間を短縮できるという。

 Sansanは今後、社名や役職、住所、電話番号など、名刺上の全項目を高精度かつ短時間で認識できるように、DSOC OCRの開発を進めるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.