歌声を合成する理由の1つに、通信データ容量の問題がある。
通信カラオケでは、歌詞、伴奏のMIDIデータ、そのほかのメタデータが1曲について必要となるが、ガイドボーカルが入ると、1曲当たり数Mバイトの歌声データが必要となってくる。それが、ボーカルアシストでは数Kバイト、1000分の1に収まる。
数万曲に及ぶカラオケ曲に人間のガイドボーカルを入れると、そのデータ容量は跳ね上がる。ボーカルアシストではSinsyやCeVIOと同様に、MusicXMLをベースにしたデータフォーマットなので、わずかな容量で済むのだ。収容するハードディスク容量、転送量の両面で効いてくるわけだ。
カラオケ店はブロードバンドばかりではない。地方では細い回線でつながっているところも多い。そうしたところではガイドボーカルを使えるメリットは大きい。
もう1つ、細い回線でもOKということは、ゲーム機やスマートフォン、タブレット、テレビなどマルチスクリーン展開をしやすいということでもある。JOYSOUNDは既にこうした家庭用デバイスでもサービスを提供しているが、そこで「ガイドボーカル」を使うことも想定している。これならばスマートフォンでも通信料金を圧迫せずに利用できるようになるはずだ。
HMMの技術を提供した名工大の学内ベンチャー、テクノスピーチでは、今回のカラオケ機採用に当たり、HMM合成を「特別なアルゴリズムにより計算量、メモリ量を削減し、実時間で動作するよう工夫」(徳田教授)しているという。
女声に関しては、サンプルのYouTube動画を見てもらえばおわかりかと思う。デモでは、「ハッピー・バースデー」を聴くことができるが、「Freely Tomorrow」「炉心融解」「ライオン」も聴いてみた。レンジが広いボカロ曲も無理なくこなしている。「ライオン」のように思い入れたっぷりに聴かせる歌は、「流している」印象を受けた。北村さんは「それが狙い」と言う。歌い方を覚えるのが目的だからだ。オリジナル歌唱っぽいものを望む場合には「本人歌唱」バージョンやそれに近いものがあり、そちらを選べばいい。「ボーカルアシストのせいで人の歌手が不要になるということはないんです」
男声では、バラード「愛のメモリー」シャウトが入る「ばくだん」を聴いた。こちらもさらりと歌っている感じ。感情がこもっている感じはあまりしないが、いっしょに歌いやすい印象はある。声質は徳永英明系のスイートボイス。ビブラートなどの表現は抑え目なのがわかる。だが、人間でないとは判別しづらい品質だ。
実は女声、男声ともにプロのシンガーで名の知れた方だという。現在は非公開。歌手のセレクション、音源用の収録に関してはJ-POPの有名アーティストがプロデュースしているが、こちらも現在非公開。こちらはいつか明らかにされるかもしれない。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR