ITmedia NEWS > 社会とIT >
ニュース
» 2019年08月21日 07時00分 公開

よくわかる人工知能の基礎知識:AI-OCR、医療、監視――広がる画像認識の可能性 (2/6)

[小林啓倫,ITmedia]

 2012年にGoogleが発表した、「ディープラーニングで画像内の猫を認識する」例を考えてみよう。人間なら多くの人が猫を簡単に認識できるだろう。チワワの写真を目の前に出されて「これは犬? それとも猫?」と急に聞かれても、大部分の人は「犬」と答えるはずだ。

 しかしなぜチワワを犬と判断できるか、言語化することは非常に難しい。猫の瞳は特徴的で、明るい場所では線のように細くなるが、暗い場所で撮影された写真であれば猫も犬も丸い瞳だ。

 大部分の猫は犬より小さいが、犬でもチワワのように小さい種類があるし、猫でもメインクーンのように体長が1メートルを超えるものがある。そして爪を引っ込められるかどうかは、静止画では判断できない。

 人間は「こういう条件がそろえば猫」というようなルールで判断しているわけではなく、生きていく中で得られた膨大なデータ(経験)の中から「猫とはこういう生き物だ」というパターンを認識している。

 従来の技術では、そうした認識の仕方を実現することが難しく、画像認識の精度は低いままだった。しかし、ディープラーニング技術が登場したことで、機械に大量のデータを与え、機械自体に対象物の特徴や処理のルールを考えさせることが可能になった。精度の高い画像認識アプリの実用化が進んだのである。

事務作業を一新する「AI-OCR」

 その代表例がAI-OCRだ。前述の通り、これまでもOCRは存在し、日本語OCRも1960年代から実用化されている。

 そこにAI技術を組み合わせることで、人間でも読みにくい文字(手書き文字など)や、指定した枠からずれて書かれている文字でも高精度な読み取りが可能になってきた。

 MM総研が2019年6月に実施したアンケートによれば、調査対象である国内企業1000社のうち「AI-OCRを導入している」と回答したのは全体の9.6%だった。未導入の企業でも51.9%が「利用に関心がある」と回答しており、読者の皆さんが初めて自社に導入するAI技術はAI-OCRということになるかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.