「VOCALOID」「Sinsy」「UTAU」それぞれの特徴は？　歌声合成技術の各陣営が語る、その違いと魅力

» 2015年03月02日 12時00分公開

[松岡洋，ITmedia]

現行版に歌声ライブラリを追加した「VOCALOID4 結月ゆかり」は3月18日発売。

　歌声合成技術の開発者やボカロファンが集まる「第01回世界ボーカロイド大会」が、2月20～21日に「ヤマハリゾートつま恋」（静岡県掛川市）で開催された。「VOCALOID」「Sinsy」「UTAU」の開発者が集い、お互いの技術をアピールした「三つ巴プレゼンマッチ」の様子をレポートする。

　登壇したのは、「VOCALOID」陣営からAHSの尾形友秀社長、「Sinsy」開発に関わった CHI-TA／arctan_Pさん、そして「UTAU」音源サポーターのデルタ＠きみがためさんの3人だ。

　尾形社長は「声」を探す重要性を強調。VOCALOIDは収録した声を音素に分解・加工して歌声を合成するため、加工に耐えうる声の持ち主を探し当てる必要があるという。長時間の収録中に安定した声を維持できることも重要で、声優がVOCALOIDに適しているのはこのような事情があるようだ。

AHS 尾形友秀社長

　各音素をつなぎあわせた上で音程を調整するため、元の声が低いと加工が歪みやすい。ハスキーボイスの音源を作るのは難易度が高いという。

歌い方の特徴を抽出する「Sinsy」

　対して、名古屋工業大学国際音声技術研究所が開発した「Sinsy」は、音ではなく歌声そのものを収録して歌い方の特徴自体を抽出するのが特徴だ。

Sinsyの仕組み

　「隠れマルコフモデル」と呼ばれる手法で、楽譜と歌声の対応関係をモデル化し、新たに譜面や歌詞を与えられると、過去の学習を踏まえて歌声提供者の声質や歌い方に近い音源を生成する。“調教”の必要なく自然な歌声を作ることができるのが魅力だ。

　歌い方の特徴を抽出するため、制作現場では数曲を同じような調子で歌ってもらう。歌手の場合は、何度も繰り返すうちに整えてしまう傾向があり、そこをあえて抑えてもらうのが音源のクオリティを上げるポイントだという。この方法でも声優を起用するアドバンテージは大きい。週をまたいでも視聴者に違和感がないよう、同じ調子で声を吹き込むことに慣れているからだ。

　SinsyはWeb上で動作し、現在使えるのは4名の5つの音源。ITmedia ニュース所属の松尾Pの声が元になっているものも含まれている。

俺、歌声になってみたから、歌わせてみない？　楽譜を入力すれば歌ってくれる「Sinsy」の中の人体験

6000以上のライブラリ「UTAU」

　「UTAU」は飴屋／菖蒲（あめや／あやめ）さんによって2008年に公開されたソフトウェア。ユーザーが音源を自由に制作できるため、現在までに世界で6000以上の音声ライブラリが公開されており、そのほとんどが無料だ。1番の魅力は音源作りも曲作りも楽しめる圧倒的な自由度だという。

連続音でのUTAU音源の作り方のイメージ

CHI-TA／arctan_Pさん（左）、デルタ＠きみがためさん

　UTAUの音源収録には「単独音」「連続音」の2つの手法がある。単独音の場合は収録は短時間で済むものの、歌声を合成すると音のつなぎが不自然になってしまう。連続音は音源の組み合わせが多くなるため、収録に時間はかかるが、よりナチュラルな歌声を生成できるという。

　この日は事前に尾形社長の声が収録されており、それを用いての歌声合成が行われた。会場からの評判も上々で今後UTAU音源の1つとして追加される予定だ。

宿泊型イベントのため、夜は座談会も。中国の歌声合成技術「ROCALOID」の現状などが紹介された

もう、ささらだけではない――「調教いらず」のCeVIOに“新人”歌手がJOYSOUNDから　おっさん・熟女の「演歌歌手」も
カラオケ「JOYSOUND」のエクシングから「CeVIO Creative Studio S」向けオリジナルソングボイス「Color Voice Series」が登場。第1弾として男女2人が発売され、さらに4人が加わる。一部で熱望されていた「おっさん声」「熟女声」も。
日本のVOCALOID発売から10年、中の人たちの思いは？　「MEIKO」生誕10周年イベントに行ってきた
日本初のVOCALOID音源「MEIKO」誕生から10年を迎えた。10周年生誕祭では、ボーカロイドの父・剣持さんとクリプトンの伊藤社長が当時を振り返ったほか、MEIKOの中の人こと拝郷メイコさんらが“VOCALOIDと中の人とのギャップ問題”を語った。
初のアメリカ英語女声ボカロ「CYBER DIVA」に歌ってもらった
ヤマハから初のアメリカ英語の女声ボーカロイド「CYBER DIVA」が登場。というわけで、早速オーディションしてみた。その実力は。
幼稚園児も“ボカロP”に？　聴き手を作り手に育てるために――専門知識ゼロで作曲できる「ボカロネット」の狙い
専門知識ゼロでも“作曲家”に――ヤマハが公開した「ボカロネット」はそんな夢を実現するサービスだ。VOCALOIDシーンを盛り上げていくため「もっと多くの人に作る楽しさを」とコンセプトを掲げる。
「VOCALOIDの父」、VOCALOIDプロジェクト離れ新たなチャレンジへ　「VOCALOIDの未来は明るい」
「VOCALOIDの父」として知られるヤマハの剣持秀紀さんが、同社内で新商品・新規事業にチャレンジする部署に異動し、VOCALOIDプロジェクトから離れたことを明らかに。「VOCALOIDの未来は明るい」とVOCALOIDの発展を後任に託している。
「東北ずん子」ボカロ化　クラウドファンディングで500万円調達
佐藤聡美さんの声を元にした、東北復興支援キャラクター「東北ずん子」のVOCALOIDソフトが発売される。
関西弁でしゃべる音声合成ソフト「琴葉茜・葵」　榊原ゆいの声で「急におもろい話なんてできへんっちゅうねん」
関西弁にも対応した音声合成ソフト「VOICEROID+ 琴葉茜・葵」が発売される。双子のキャラクターの声優はともに榊原ゆいさん。
俺、歌声になってみたから、歌わせてみない？　楽譜を入力すれば歌ってくれる「Sinsy」の中の人体験
自分の知らないところで、自分の声が、知らない曲を歌っている――そんな展開を期待してます。