NTT(日本電信電話)は7月10日、音を認識するために訓練したディープニューラルネットワーク(DNN)が、ほ乳類の脳と類似した反応を示すことが分かったと発表した。ほ乳類の聴覚神経系が、音の情報処理において合理的にできていることを示唆しているという。
ヒトを含むほ乳類の脳は、音が耳に届いてから認識するまでに、脳幹や大脳皮質など多くの段階で音の特徴を分析し、それに応じた反応を見せる。例えば音を認識する上で重要な手掛かりとされる振幅変調(音の大きさの緩やかな変化)では、その波形に同期して神経が発火する(神経反応)。
また細胞によって特定の周波数のみに強く同期する「変調チューニング」が見られたり、より中枢に近い神経細胞のほうが同期できる周波数の上限が低いなどの特徴がある。しかし、これまでの神経生理学のアプローチでは、なぜこうした特徴が現れるのか分からなかった。
今回の研究では、動物の聴覚神経系と同様、多数の層が重なった構造を持つDNNを用い、自然な音を認識するように訓練した。その上で神経生理学の実験を模し、音を入力したときの個別の素子の反応を記録した。
すると変調チューニングを示す素子が存在したり、出力側に近い層(中枢に近い)が同期できる変調周波数の上限が低かったりと、ほ乳類の聴覚神経系と類似した傾向が見られたという。音の分類精度が高いDNNほど、脳との類似性も高かった。
NTTでは、「神経生理学の実験手法がDNNにも応用できる可能性を示したことは、機械学習の技術開発においても意義がある」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR