“人の動作”を認識する人工知能が登場 8割強の認識精度

動いている人の映像を見て、“何をしているか”を判別――。NTTコミュニケーションズが人工知能「時系列Deep Learning」を開発した。防犯やマーケティングに役立つという。

» 2015年10月13日 16時39分 公開
[ITmedia]
Photo

 NTTコミュニケーションズ(以下、NTT Com)が、人間の動作を理解する人工知能「時系列Deep Learning」を開発したことを明らかにした。人がいる映像に対して動作を検知させたところ、8割強の精度で識別したという。

 ディープラーニングは、人工知能の発展におけるブレークスルーとして注目されている多層構造のニューラルネットワーク。従来型の機械学習と異なり、ルールを教え込むことなく、自動で物事を解釈するために必要な特徴や要素を抽出する。時系列データの解析によって、映像から人の動作を高精度に識別できるようになり、防犯など新たなビジネス領域への応用が可能になる。

 ディープラーニング技術が発展した結果、静止画に写っている物体や人間に対する認識精度は飛躍的に向上したが、人間の動作などの映像を始めとする、連続した時間の変化を捉えてはじめて意味があるものに対する解析については、現在も高精度の認識が困難な状況だ。

 今回開発された技術では、映像をフレームごとの静止画に分解し、1フレームにおける分析対象範囲(フィルタ)内ピクセルのみではなく、近い時間軸フレームの範囲内ピクセルに対しても局所結合(畳み込み結合)を行う。

 与えられたデータの各位置や各箇所を学習して特徴を抽出する方法を「畳み込み(Convolution)学習」といい、今回開発された技術は、畳み込み学習の際に、画面内のx軸、y軸に加え、t軸(時間)も考慮した3次元でのディープラーニング技術となる。

Photo 映像全体を解析することで、高い精度で人間の動作を判別できるようになった

 2015年10月に行った同技術の実験において、ネットワークカメラなどで撮影した人間がいる映像に対して、「しゃがんでいる」「きょろきょろしている」「ものを置いている」などの動作を人工知能に検知させたところ、8割強の高い精度で正答。実験の成功で、“人間の動き”を分析することが重要と考えられる防犯分野における活用や、工場での異常検知、店舗での購買行動分析、スポーツにおけるプレーの分析など、さまざまな領域への応用可能性が広がったという。

 NTT Comは、時系列Deep Learningの技術を活用し、防犯やマーケティングなどさまざまな用途に応じた映像データの解析を可能とする「映像解析プラットフォームサービス」(仮称)の提供を検討している。

 今後は映像データだけでなく、さまざまなIoT端末を通じて収集したセンサーデータ、端末ログなどを統合的に分析し、より高度な解析を行うことで、ビジネス領域への応用範囲を広げていくとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ