日本電信電話(NTT)は5月27日、さまざまな音に対して、それがどんな音なのかを説明するテキストや擬音語を自動生成する技術を開発したと発表した。例えば、鳥の鳴き声なら「ピヨピヨ、ピピピ」「小鳥が甲高い音色で鳴いています」など、擬音語と説明文を生成する。人の会話以外の音をテキスト化できることで、音の検索や字幕生成などの精度向上に役立つという。
脳の神経回路網を模した多層ニューラルネットワークを活用し、教師データとして特定の音と対応する擬音語や説明文を機械学習させる。学習したデータをもとに、音の特徴を取り出して対応するテキストに変換する仕組みを開発した。
ある音から自動生成した擬音語と、人間が考えた擬音語を比べたところ、異なる単語が生成されたのは全体の7.2%だった。自動生成した擬音語のうち、全体の78.4%は人間が聞いても違和感を覚えず、人間が考えた擬音語よりも評価が高かったという。
同社はこれらの技術を使って、事前に説明タグなどを付与せずに検索できる音のデータベースを開発できるとしている。
関連記事
- 「ラーメン二郎」全店舗“見分ける”bot NTTコムウェア技術者が趣味で開発
「ラーメン二郎」のラーメン画像をリプライすると、どこの二郎なのか答えてくれる――そんなTwitterのbotアカウントを、NTTコムウェアの技術者が趣味で開発した。正答率は約87%という。 - ディープラーニングの「教師ラベル不足」とNTTの解決策
応用範囲の広さから期待が集まるディープラーニングの技術だが、AIに読み込ませるための膨大な学習データが必要なため、ハードルが高いと考える人は多い。NTT研究所が、少ない学習データから効率的に学習できる技術を開発した。 - 「特殊詐欺の電話」AIで見破る NTTグループが実証実験 犯人が使う表現を学習
NTTグループ4社が、クラウドとAIを用いて特殊詐欺被害を防ぐ実証実験を行うと発表。実験の開始時期は2019年度第2四半期(7〜9月)、実施エリアは東京都内を想定。使用するAIには、実際の詐欺事件の犯人が使った言い回しを学習させる予定。 - 「透ける電池」、NTTが開発 “サングラス並み”の透過率
NTTが「透ける電池」を開発した。透過率は平均約25%で、向こう側が透けて見える一般的なサングラスと同等。 - 「みんなでキャラクターを育てる」 NTTレゾナント、誰でもチャットbot作れる「goo botmaker」開発へ
NTTレゾナントが、エンドユーザー向けのチャットbot作成サービス「goo botmaker」を発表。今年度中の公開を目指し、壽屋と共同プロジェクトを開始した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.