ITmedia NEWS >

声と楽譜と歌詞から“こぶしの効いた演歌”を合成 NTTが新技術

» 2004年02月06日 18時35分 公開
[ITmedia]

 NTT(持株会社)は2月6日、音声データと楽譜と歌詞から歌声を生成する技術「ワンダーホルン」のライセンス提供を、NTTアドバンステクノロジ(NTT-AT)を通じて開始した。同技術が体験できるサイト「うたばら.com」もオープンした。

 NTTが2000年に発表した歌声合成技術「ホルン法」を改良したもの。人の声を収録した歌声データベースに、楽譜・歌詞を組み合わせると、楽譜のメロディと歌詞通りの歌声を生成する。

 歌声特有の倍音構造を忠実に再現したほか、歌声から抽出した特殊ノイズをミックスすることで、個人の歌声の特徴をより精密に再現できるようになったという。

 ビブラートやこぶし回しなどといった「歌唱スタイル」調整機能を組み込んだ。演歌からポップスまでさまざまな歌声の合成が可能だ。少人数の歌声を足し合わせて大合唱にもできる。

 ハイスペックなPCでなくても利用できるよう、アルゴリズムも軽量化し、歌声データベースも圧縮した。家庭用ゲーム機やDSP(Digital Signal Processor、用語辞典を参照)搭載カラオケ機などでも動作する。

 楽譜や歌詞の入力はMIDIに対応。カラオケ用MIDIデータからバックコーラス歌声を生成したり、PCで編集したMIDIのメロディーに歌詞をつけて楽しめる。

 うたばら.comでは、サイト上に用意されたサンプル歌声データベースを使って歌声合成機能を試せる。

 同技術は、ゲームの効果音やキャラクターの歌声、カラオケのバックコーラス、歌うロボットの歌声といった利用を想定している。同社によると、セガが同技術をゲームソフトなど向けに採用することを検討しており、NTT-ATとライセンス提供に向けて交渉中だという。

Copyright © ITmedia, Inc. All Rights Reserved.