ITmedia NEWS > 製品動向 >

3分で“神調教”に? Netぼかりすα版で曲を作ってみた(2/3 ページ)

» 2009年04月28日 17時02分 公開
[松尾公也,ITmedia]

自分の歌をミク、ルカの歌声に変換してみた

 1分から2分程度の長さを持つ元歌WAVファイルを送って実際に試してみた。サンプルに使ったのは自作の2曲。1つは80年代風バラード「さよならゴメン」、もう1つは和田アキ子風歌謡曲「古いダイアリー」。自分が歌いやすいメロディー、音域に設定してある。

 オケはあらかじめある程度作っておいて、メロディーガイドとなるトラックも作っておく。それを聞きながら、元歌を録音していくわけだ。元歌が調子はずれだと、Netぼかりすも正確にその音痴っぷりのままで戻してくれるので、この段階で、声のチューニングはきっちり合わせておく必要がある。

 オケをMP3化するなどしてiPodなどで聞きながら、ビデオカメラでボーカル録りをするなども可能だが(実際に1曲ではその方法でやってみた)、何度かリテイクをして、調子はずれの部分を歌い直したほうが、後でVOCALOID Editorで作業する部分が少なくてすむため、できればやっておいたほうがいい。

 DAWなどで編集した元歌は、いったんWAVで吐き出しておく。歌った部分の歌詞も同時に用意しておく必要がある。

 「人の波をかきわけて あなたを探す地下街の通路で」といったような歌詞を書いたテキストファイルと、上述のWAVファイルをPC上に置いて、NetぼかりすのWebアプリから送出する。そのときに、インストールされているVOCALOIDシンガーから適切なものを選び(複数がインストールされている場合)、元歌から音程を変更する度合いを半音単位で-12〜+12で指定する。

 デフォルトのBPM(テンポ)はVOCALOID Editorと同様に120だが、歌詞ファイルに記述することで、バッキングトラックに合わせたBPM指定が可能。また、ピッチベンド変更の範囲(PBS)を指定することも可能なので、VOCALOID Editor上で音程を細かく編集していくときには便利だ。

 Netぼかりすによって吐き出されたファイルに書き込まれるのは、ピアノロールにノート情報(歌詞と音程、音長)、さらにパラメータとして音量情報のDYN、細かい音程情報のPITと、その幅を決めるPBSだ。このDYNとPITにより、ビブラートや微妙な節回しを表現し、元歌の歌手の歌い方をまねしてくれるのだ。

 例えば音を長く伸ばして後半にビブラートをかける場合でも、音量のビブラートと音程のビブラートが微妙に異なる場合があるが、そこの部分も元歌から抽出して再現する。VOCALOIDシンガーが元からもっている特性を、この歌い方によって上書きしてしまうこともできる。

 その特性はデータベース化されていて、例えば初音ミクと巡音ルカのボーカルのそれぞれの特性に合わせたVSQファイルを吐き出す仕組みになっている。初音ミクは比較的平坦な歌い方をし、音を伸ばすときにも、音量がほぼ一定のままだが、巡音ルカは音量の減衰が早く、後半部分のDYNを意識的に持ち上げていかないと同じような歌い方はできない。Netぼかりすはその補正作業を自動的に行ってくれる。また、巡音ルカはバイリンガルのシンガーなので、特有の発音指定が利用できるので、それにも対応している。

 だから、最終的に使うシンガーを決めたうえでNetぼかりすのシンガー指定をしておく必要がある。その後の変更も不可能ではないが、VOCALOID Editor上での作業が多く発生するかもしれない。

 やってみて一番苦労したのは、Netぼかりすが歌手の歌い方に忠実すぎるために、自分の音程の不安定さやリズム感の悪いところまで再現してしまうところ。これは、元歌を録り直したり、いいテイクをつなげていって問題ないレベルまでもっていくしかない。本物のぼかりすには、「歌唱力補正機能」があるが、Netぼかりすにはまだ実装されていない。この機能が追加されれば、MIDIキーボード入力におけるクォンタイズ(リズムの不正確さや音量のバラツキを修正してくれる機能)に相当するような手軽さが生まれてくるのではないだろうか。

 もう1つは、歌い方によるのだろうが、一部の歌詞の割り付け(アラインメント)がうまくいかないというところ。音声認識で元歌と合わせているわけではなく、テキストに記述された歌詞の長さを割り付けるようになっているようで、1つ間違えるとその後がしばらくずれてしまう。そうすると、VOCADLOID Editor上での作業が大変になってしまう。

 ヤマハではその対策として、歌詞ファイルに、「00:11:11」など歌詞の特定部分を時間指定することができるようにしている。

 この歌詞アラインメントで、音声認識と組み合わせられるようになれば、さらに正確さは増していくのではないだろうか。

 自分ができる範囲でのNetぼかりす作品はこの2曲程度で、それなりの限界も見えると思うが、ほかのVOCALOIDユーザーの作品もニコニコ動画にたくさん投稿されるので、そちらも参考にしてほしい。

Copyright © ITmedia, Inc. All Rights Reserved.