News 2000年11月22日 11:05 PM 更新

電話の音声をリアルタイムにゆっくりに変換──三洋が開発

三洋電機が開発した「ゆっくり通話技術」は,電話音声を聞きやすいスピードに変換する上,音程も低くならずに自然なままだという。

 三洋電機は11月22日,電話での会話を聞き取りやすい速度にリアルタイムで変換する「ゆっくり通話技術」を開発したと発表した。独自の話速変換技術により,実際の声の音程を変えずに発話のスピードを落とし,さらに遅延も最小限に抑えたという。同社では同技術を活用し,高齢者でも通話を聞き取りやすい電話機の開発を図っていく考えだ。

 同技術の主な特徴は,

  • 音声を自然でゆっくりとした速度に変換
  • 音声スピードの変換に伴う遅延を低減
  • 自分の発話がゆっくりになって戻ってくるエコーをキャンセルする

の3つ。

 音声は電磁波と同様に波の性質を持ち,音の高低(音程)は周波数と同じ単位のHz(ヘルツ)で表される。ある音声を単純に遅くすると,音声信号の基本周期(波長)もその分引き延ばされる。つまり波長が長くなり,周波数は低くなるため,音程も低く聞こえるようになる。人の声を録音して低速で再生すると“バルタン星人状態”になるのはこのためだ。

 この課題を克服するため,ゆっくり通話技術では原音の基本周期を検出して同周期の信号を合成。引き延ばした音声信号に合成した信号をミックスして出力することで,音程の変化がない自然な音声に変換できるようになったという。

 ただ音声の速度を落とせば,実際の通話とのタイムラグが生じてしまい,スムーズな会話ができなくなってしまう。そこで同技術では,会話の有音部分と無音部分を検出,有音部分のみを速度変換し,無音部分は適度に削除することでリアルタイム性を高めたという。

 また発話者の声が電話機内を経由して受話器にエコーとして聞こえる「側音」と呼ばれる現象により,発話者の声もゆっくりになって聞こえてしまうという課題があったが,独自のエコーキャンセラーを開発することで克服した。

 同技術を開発したのは同社ハイパーメディア研究所。平均年齢約68歳の男女55人に対し評価実験を行ったところ,同技術を使った結果,早口の音声を聞き取りやすくなっていることが確かめられたという。

 また同時に行ったアンケートによると,電話の声が早すぎると感じたことがある被験者は6割に上ったという。TVアナウンサーの音声を時系列的に分析したある調査によると,時代が下るにつれて音程が高くなり,また発話も早くなる傾向になっているという。早口で何を言っているか分からない電話に返事をし,欲しくもない商品を買わされてしまった高齢者の例も実際にある。三洋では高齢者向けにゆっくり通話技術の需要は高いと見て,今後は同技術を搭載した電話機の開発を進めていく方針だ。

関連リンク
▼ 三洋電機

[小林伸也, ITmedia]

Copyright © ITmedia, Inc. All Rights Reserved.