NEC、音で状況を認識する「音状況認識技術」を開発 犯罪や事故の検知に期待

AIを活用して見えない場所で起きている事象を音から認識する技術を開発。雑音が多い広い範囲から収集した音からでも小さな音を逃さず高感度に検知するという。

» 2016年11月29日 07時20分 公開
[ITmedia]

 NECは11月28日、収集した雑多な音の中から目的の音を切り分け、起きている事象を認識する「音状況認識技術」を開発したと発表した。公共施設や観光地などでの犯罪・事故の検知や、高齢者宅の生活音を利用した見守りといった活用を見込む。

 今回開発された音状況認識技術は、マイクで収集した音を“目的音”と“環境雑音”に分け、目的音から細かい構成音を抽出する「構成音抽出技術」と、構成音の組み合わせパターンから事象の有無を判別する「事象判別技術」から成る。従来の技術では、特定の環境で目的の音を大量に学習することで検知を行っていた。しかし、広い範囲から目的の音を収集する際は多くの環境雑音が混入するため、検知感度や認識精度が低下し、また目の的音を個々の環境ごとに学習させる必要があるため未知の環境への導入が難しいといった課題があったという。

Photo 「音状況認識技術」の概要

 例えばガラスが割れる音の場合、「ガシャン」「バリン」「パリン」などと環境によって音が変わるが、あらかじめ「ガ」「シャ」「バ」「パ」といった環境の違いに影響されない細かい音の成分(構成音)に分けて学習させておき、学習していない未知の構成音を環境雑音に分けることで、環境雑音の影響を受けることなく、高精度に構成音を抽出するという(構成音抽出技術)。

 また、「ガ」「シャ」「バ」「パ」などの構成音の組み合わせを事象パターンとしてあらかじめ学習し、構成音抽出技術で高精度に抽出した構成音と照合することで、目的とする事象の有無を判別するという(事象判別技術)。

 NECでは、これらの技術によって、環境雑音が多い広い範囲でも小さな音を逃さず高感度に検知でき、また目的音を環境ごとに学習させる必要がないため、未知の環境への導入がしやすくなると説明している。

Photo 「構成音抽出技術」と「事象判別技術」の概要

 なお同技術は、音響検知の国際的なコンテスト「DCASE2016」の雑音中の日常音検知部門で第1位を獲得したという。NECでの検証によると、従来4メートル相当だった検知距離を従来比5倍の20メートルに伸ばし、監視カメラの設置間隔の間をくまなくカバーできる性能遠距離をシミュレーションで確認とのこと。


 このような音による状況認識技術は、犯罪防止や高齢者などの見守りなどだけでなく、生産設備の異常音や災害の前触れとなる音などを学習させて活用するなど、さらに利用範囲が広がっていくと期待される。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ