ITmedia NEWS > ネットの話題 >

さらにリアルな歌声を手に入れたVOCALOID――Netぼかりすの進化と本家ぼかりすの未来(3/3 ページ)

» 2009年08月05日 11時59分 公開
[松尾公也,ITmedia]
前のページへ 1|2|3       

歌声のスタイルを変える

 元の歌唱にどれだけ近いかは、音量の変動をグラフ化した、2番目のウィンドウを見るとよく分かる。赤い線が元歌唱で、青い線が本家ぼかりすによる模倣だ。

画像

 次は歌唱スタイルを変える機能を試してみる。歌うスタイルで最も特徴的なのは、ビブラートだ。今回の元歌唱では、ビブラートがちょっと足りないなと感じていたので、そこを強調できると、自分にとって理想に近い歌い方になる。そこで、本家ぼかりすでそんなことが可能か尋ねてみた。

 すると、ビブラートの部分だけを強調できるのだそうだ。

 実はこの時点でビブラート領域の自動検出もできているということも知らされた。

画像

 ビブラート領域は2番目のウィンドウの下枠にピンク色に表示され、この歌では4カ所検出されている。「山が4回あるとビブラートっぽく聴こえるとして、ビブラートとして検出する」と中野氏は説明する。

 本家ぼかりすでは、ビブラートの領域(V)とビブラートではない領域(nV)を別個にピッチと音量の変動を修正することができるのだ。ここではVを2.5倍、nVを逆に0.5倍に抑える指定をしてみた。青い線が変更を加えた合成音で、赤い元の音声よりもビブラートとそれ以外の部分の差が強調されたものになっている。

 ビブラートを強調した音声はこのようになる。

 ビブラートを強調しない音声はこちら。

 発声の不安定な変化は抑制して、ビブラートだけ強調した歌い方になるため、変な言い方だが最初のぼかりすミクよりもさらに「ミクっぽくなっている」という印象だ。ビブラート以外の部分は音程に比較的忠実で、ビブラートはここぞとばかりに派手に揺らす、プロっぽい歌い方になるのだ。これなら人前に出しても大丈夫という気になる。

歌がうまくない人でも使える?

 ビブラートをかけるというのは歌い手にとってはかなりハードルが高いテクニックだ。しかし、中野氏に教わった必殺テクニックがある。このビブラートは、逆に働かせることもできるのだ。

 例えば、きれいなビブラートを最初からかけるのは難しいけれど、音を伸ばしたときにアウアウアウアウといったふうに、かなり大げさに音を揺らすことはほとんどの人ができる。そうすれば、そこをビブラート領域として判断してくれるから、今度は逆にビブラートを0.5倍に抑えるとかすれば、うまい歌唱のように聞こえるそうだ。「おおげさビブラート入力」とでも名付けたい、本家ぼかりすならではのTipsだ。

 「歌がうまい人だけが使える」という風評は、これで払拭できるのではないだろうか。

 今回は解説を含めたデモだったため10分以上を要したが、実際の作業ではわずか数分。指定するポイントは数カ所と、エンドユーザーの手をほとんどわずらわせることなく、「うまくきこえる歌声」に変えてくれる。

 一応、バッキングをつけた比較演奏はこちら。最初は元歌で、次は初音ミクがうたった、ビブラートを2.5倍に強調したぼかりす版である。

 さらに比較のため、ニコニコ動画に投稿してある元曲を挙げておく。こちらは、Netぼかりすの5月時点でのバージョンに、さらに修正を加えたものだ。出だしを比較していただけば分かるが、修正しても、まだ本家ぼかりすには及ばない。

 なお、本家ぼかりすのユーザーインタフェースについては、中野・後藤両氏がニコニコ動画に投稿した、下記動画をみていただきたい。

 歌い手のピッチのずれを補正する「調子はずれ補正」、指定した区間の音の高さを変える「音高トランスポーズ」は、このデモでは試さなかったので、具体的なユーザーインタフェースはこの動画をご覧いただきたい。「調子はずれ補正」については、Netぼかりすのオプションであるfixpitchで一部実装されている。

 本家ぼかりすが、人間がうたった歌唱をそっくりにVOCALOIDが歌えるかたちにデータ化してくれるのは、これでお分かりいただけたかと思う。

「本家ぼかりす」はどこへ進むのか?

 「本家ぼかりす」のデモを見ると、ユーザーインタフェースも含め、完成に近いレベル。もうやることは残ってないのではないかと思ったが、後藤氏は反論する。「これはゴールではない。究極の歌声合成へ向けて、まだまだ解決すべき問題は多い。」その考え方の一端は、下記のインタビュー(13分付近から)を見ても分かる。

 一方、「GENやOPEといった、ぼかりすではまだいじっていないパラメータを調整することでさらにリアルな歌声にすることはできるのではないか」といった指摘や、「シャウト系、ささやき系のボーカルにも対応してほしい」といった要望は産総研のお2人に伝えられた。ボーカルのタイプについては、サンプルが豊富に得られれば対応できるかもしれないということで、今後の対応に期待していいかもしれない。

 デモの後で、後藤氏から、ぼかりすとはまったく異なるアイデアの歌声情報処理に関するデモが行われ、参加者を驚かせた。隠し球はまだたくさんあるということがそれだけでも十分に確信できた。ここで漏らすことができないのが残念なくらいだ。

 ぼかりすにしても、これまでの公開動画は日本語のみだったが、なんと英語の歌唱にも対応できる研究が進められていて、8月4日、下記の動画が投稿された。

 外国曲のVOCALOID入力は、日本語以上に難しい。その困難さが国際対応ぼかりすにより一部でも克服できれば、英語圏へのVOCALOID本格進出が実現するかもしれない。いまは日本と一部のアジア圏にとどまっているVOCALOID人気が世界中で爆発するきっかけとなるだろう。

 産総研の後藤・中野チームは「歌声表現の幅を広げる」という目的のために、今後もニコニコ動画をはじめとするCGMの場を使い、実際の利用者とコミュニケーションをはかりながら新たな技術を作り上げていくのだろう。そのときにはNetぼかりすが重要な役割を果たしているかもしれないし、ひょっとしたらVOCALOIDの次期バージョンが一部の機能を担うのかもしれない(「VOCALOIDの父」であるヤマハの剣持秀紀氏も同席した)。

 いずれにせよ、Netぼかりすや本家ぼかりすの動画コメントでリスナーやクリエイターが投げる感想、アドバイスなどのコメントが、彼らの技術の進化にきっと役立つはずだ。そしてその技術はいつか、われわれが手にするものなのだ。

5日午後5時追記

 記事掲載後、産総研の後藤・中野両氏からニコニコ動画に新たな投稿があった。ぼかりすに対応したばかりのメグッポイド歌唱によるポップチューン「遥かな想い」のGENパラメータを3パターンに変えたものだ。「GEN=64」が標準、「GEN=40」はより幼く、「GEN=90」は大人びた感じ。



前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.