ITmedia NEWS > 社会とIT >
ニュース
» 2019年08月21日 07時00分 公開

よくわかる人工知能の基礎知識:AI-OCR、医療、監視――広がる画像認識の可能性 (1/6)

ビジネスに役立つAIの基礎知識について分かりやすく解説する連載。今回のテーマは「画像認識」について。

[小林啓倫,ITmedia]

 ビジネスに役立つAIの基礎知識について分かりやすく解説する本連載。これまでAIの仕組みや歴史、各国の取り組みなど、さまざまな角度から「AI」というテクノロジーについて考えてきた。

 本記事以降では、AIの具体的な応用例やアプリケーションについて見ていきたい。憶測や理想論で語られがちなAIだが、現時点では実際にどのようなアプリが実用化されているのだろうか。今回は、画像認識の分野について考えてみたい。

連載:よくわかる人工知能の基礎知識

いまや毎日のようにAI(人工知能)の話題が飛び交っている。しかし、どれほどの人がAIについて正しく理解し、他人に説明できるほどの知識を持っているだろうか。本連載では「AIとは何か」といった根本的な問いから最新のAI活用事例まで、主にビジネスパーソン向けに“いまさら聞けないAIに関する話”を解説していく。

(編集:ITmedia村上)

そもそも画像認識とは?

 画像認識、あるいは映像認識とは文字通り、静止画や動画を分析し、そこに何が映っているのかを把握する技術だ。認識する対象は文字や動植物、商品のブランドなど多岐にわたり、動画内から特定の行動(動き)を把握するといった取り組みも行われている。

 もちろん、必ずしもAIを使つ必要はない。ジェットエンジンがなくても、プロペラ機や気球が空を飛べるのと同様に、AI以外の画像認識技術も使われてきた。

 例えば文書の画像からその中にある文字を読み取るOCR(光学文字認識)は、20世紀初めから研究が始まっており、日本でも国産のOCR機が1968年に発表されている。そのためAI技術を活用したOCRは「AI-OCR」と呼ばれている。

 画像認識は現在の「第3次人工知能ブーム」を象徴する分野といえるだろう。本連載の第2回で解説したように、現在のAIブームを後押しするのは機械学習、特にディープラーニングの技術だ。

 ディープラーニングでは、人間が事前に「こういう特徴があればそこに映っているのは猫」というルールを設定したり、対象物が持つ特徴をどう処理するか設計したりする必要がない。そのため画像認識のように、事前の設定・設計が難しい分野で威力を発揮する。

       1|2|3|4|5|6 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.