計算機能のないアナログデバイスがAIになる? NTTの「物理ニューラルネットワーク」が不思議
NTTグループで、計算機能を持たないアナログデバイスを使って、認識型AIのような仕組みを実現する研究が進んでいる。実用化できれば、アナログな情報からデジタルデータへの変換が不要になり、低消費電力化や高速化が期待できるという。
「アナログデバイスがAIになる」──そんな不思議な技術をNTTの研究機関が開発している。AIというと、コンピュータに画像を入力すると、そこに映っているものの名前を出力するといったものをイメージするかもしれない。しかしNTTの研究では計算機能を持たないデバイスでもAIのように文字認識や音声認識ができるというのだ。
米NTT Researchが開発したのは「物理ニューラルネットワーク」という技術。スピーカーとマイク、電子回路、光学システムといったアナログなデバイスで認識型AIのような機能を実現しようという研究だ。実用化できれば、アナログな情報からデジタルデータへの変換が不要になり、低消費電力化や高速化が期待できるという。
研究員の小野寺太津博さんはNTTの技術イベント「Road to IOWN 2022」で、その仕組みを解説した。
認識型AIは、例えば画像を入力すると、そこに映ったものの名前を出力するといったような働きをするAI。スピーカーとマイク、電子回路、光学システムも、音や光といった入力を与えれば電気信号などを出力できるため、適切な入力方法と出力結果の読み取り方を定めれば認識型AIのような判定機を作れる可能性がある。
例えばスピーカーとマイクを判定機にする場合、認識したい電気信号をスピーカーに入力すると音声が出力される。それをマイクで拾って再度電気信号にする。この電気信号をあらかじめ設定した定義に基づいて読み取れば、入力した信号の内容が何だったか分かる──このような仕組みが作れれば、コンピュータを使わなくても認識ができる。
NTTの研究チームはこれを実現する方法を見つけた。認識したい画像や音声に「パラメーター」と呼ばれる付加情報を加え、音声デバイスや電子回路に入力する。そして、その出力結果があらかじめ定義した形になるよう、何度も試行する中でパラメーターを調整する。この調整作業はコンピュータも使って行うが、パラメーターが一度定まれば、デバイス単体で認識できるようになる。
例えば「8」と書かれた画像をスピーカーとマイクで文字認識する場合を考えてみる。画像をマイクで認識できるように、いったん画像情報を電気信号として整理する。ここに学習で割り出したパラメーターを加えてスピーカーに入力して音声化。マイクで検出すると出力結果が“8を示す形”になる。こうしてNTTは、計算機能を持たない音声デバイスでも文字認識AIのような働きを実現した。
現状は手書き数字の画像7万枚を収録したデータセット「MNIST」で学習と認識に成功。長文の認識や顔認識といった機能の実現にはまだ遠いが、今後はより高度な画像・音声認識ができるよう研究を進めるとしている。
関連記事
- クリスタ、画像生成AIを試験導入へ 「Stable Diffusion」が作画補助 「AIと創作活動の共存を模索」
セルシスは、ペイントソフト「CLIP STUDIO PAINT」(クリスタ)の作画補助機能として、画像生成AIを取り入れた機能「画像生成AIパレット」を試験導入する。クリスタ上で文書を入力すると、それに合った画像をAIが自動生成する。 - 「10秒でイメージ通りに」 お絵かきAIが変える“デザイン” あるネットショップでの使い方
「AIお絵描きツールのmidjourneyで、アクセサリーごとにオリジナルのラッピングをしています」。輸入雑貨などのネットショップで。 - 「Stable Diffusion 2.0」リリース 高品質化、アダルト排除、解像度アップ、奥行推定など機能追加
英Stability AIが画像生成AI「Stable Diffusion」のバージョン2.0をリリースした。生成画像の高品質化に加え、アダルトコンテンツの排除、画像内容の奥行きを保持しながらの画像変換などの新機能を追加した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.