ITmedia NEWS > 速報 >
ITmedia AI+ AI活用のいまが分かる

鳥の鳴き声→「ピヨピヨ」 音から擬音語を生成する技術、NTTが開発

» 2019年05月28日 17時30分 公開
[山口恵祐ITmedia]

 日本電信電話(NTT)は5月27日、さまざまな音に対して、それがどんな音なのかを説明するテキストや擬音語を自動生成する技術を開発したと発表した。例えば、鳥の鳴き声なら「ピヨピヨ、ピピピ」「小鳥が甲高い音色で鳴いています」など、擬音語と説明文を生成する。人の会話以外の音をテキスト化できることで、音の検索や字幕生成などの精度向上に役立つという。

photo 技術の仕組み

 脳の神経回路網を模した多層ニューラルネットワークを活用し、教師データとして特定の音と対応する擬音語や説明文を機械学習させる。学習したデータをもとに、音の特徴を取り出して対応するテキストに変換する仕組みを開発した。

photo 説明文の生成例

 ある音から自動生成した擬音語と、人間が考えた擬音語を比べたところ、異なる単語が生成されたのは全体の7.2%だった。自動生成した擬音語のうち、全体の78.4%は人間が聞いても違和感を覚えず、人間が考えた擬音語よりも評価が高かったという。

 同社はこれらの技術を使って、事前に説明タグなどを付与せずに検索できる音のデータベースを開発できるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.