ITmedia NEWS > 科学・テクノロジー >

計算機能のないアナログデバイスがAIになる? NTTの「物理ニューラルネットワーク」が不思議

» 2022年12月01日 12時00分 公開
[谷井将人ITmedia]

 「アナログデバイスがAIになる」──そんな不思議な技術をNTTの研究機関が開発している。AIというと、コンピュータに画像を入力すると、そこに映っているものの名前を出力するといったものをイメージするかもしれない。しかしNTTの研究では計算機能を持たないデバイスでもAIのように文字認識や音声認識ができるというのだ。

photo 物理的なシステムを使った画像分類

 米NTT Researchが開発したのは「物理ニューラルネットワーク」という技術。スピーカーとマイク、電子回路、光学システムといったアナログなデバイスで認識型AIのような機能を実現しようという研究だ。実用化できれば、アナログな情報からデジタルデータへの変換が不要になり、低消費電力化や高速化が期待できるという。

 研究員の小野寺太津博さんはNTTの技術イベント「Road to IOWN 2022」で、その仕組みを解説した。

 認識型AIは、例えば画像を入力すると、そこに映ったものの名前を出力するといったような働きをするAI。スピーカーとマイク、電子回路、光学システムも、音や光といった入力を与えれば電気信号などを出力できるため、適切な入力方法と出力結果の読み取り方を定めれば認識型AIのような判定機を作れる可能性がある。

 例えばスピーカーとマイクを判定機にする場合、認識したい電気信号をスピーカーに入力すると音声が出力される。それをマイクで拾って再度電気信号にする。この電気信号をあらかじめ設定した定義に基づいて読み取れば、入力した信号の内容が何だったか分かる──このような仕組みが作れれば、コンピュータを使わなくても認識ができる。

photo

 NTTの研究チームはこれを実現する方法を見つけた。認識したい画像や音声に「パラメーター」と呼ばれる付加情報を加え、音声デバイスや電子回路に入力する。そして、その出力結果があらかじめ定義した形になるよう、何度も試行する中でパラメーターを調整する。この調整作業はコンピュータも使って行うが、パラメーターが一度定まれば、デバイス単体で認識できるようになる。

 例えば「8」と書かれた画像をスピーカーとマイクで文字認識する場合を考えてみる。画像をマイクで認識できるように、いったん画像情報を電気信号として整理する。ここに学習で割り出したパラメーターを加えてスピーカーに入力して音声化。マイクで検出すると出力結果が“8を示す形”になる。こうしてNTTは、計算機能を持たない音声デバイスでも文字認識AIのような働きを実現した。

 現状は手書き数字の画像7万枚を収録したデータセット「MNIST」で学習と認識に成功。長文の認識や顔認識といった機能の実現にはまだ遠いが、今後はより高度な画像・音声認識ができるよう研究を進めるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.