ITmedia NEWS >
音声言語インタフェース最前線

「あなたに似た声」、なんのために?(2/2 ページ)

» 2018年06月08日 14時19分 公開
[松尾公也ITmedia]
前のページへ 1|2       

コエステーションの前身は6年前?

 実は、東芝が無料で提供するカスタム音声合成は6年前に行われている。コエステーションの前身と言っていいものだ。

photo ToSpeakで自分の「声の素」ができた

 87の文をWeb上で読み上げてしばらくすると、自分に似た「声の素」ができあがる。このときはある意味コエステーションよりも進んでいて、歌もうたえた。筆者の声を元にしたToSpeakの歌と自分の歌声を交互に流してみたのがこれだ。

 残念ながらこのサービスは期間限定で、既に終了している。

 6年前のこのブログで筆者はこう提言している:

 ToSpeakは、iPhone、Androidで音声データベースの登録とかできるといいと思う。Flash使ってなけりゃ、いまでも可能。再生だけなら現在もできる。ヘッドセットが標準でついてるんだから、むしろPCじゃなくてスマートフォンでやるべき。

自分の声を登録しておいて、好きなときに好きなフレーズを自分の声で再生できる。歌も歌える。そんなREGZA Phoneだったら買っちゃうよ。でも、iPhoneアプリで出すと、世界的にかなり売れると思う。

 東芝デジタルソリューションズの担当者はひょっとしてこのブログ読んでたんですかね……。

 Open JTalkを使った自分の合成音声「松尾P」と、コエステーションのコエレベル5になった自分の合成音声、どちらも自分の声を素材とした「声」だが、いかがだろうか? Open JTalkはMac用アプリはないので、ターミナルコマンドから打ち込んでいる。ラズパイなどのIoTデバイスに組み込むことも可能だ。

 一方、コエステーションはiPhoneからしかTTSできないが、150文字までという長文が一気に読める。イントネーションや製品名などの読みもなかなか優れている。

 そして筆者は今、コエステーションで自分以外のコエを育てている。妻が5年前に遺した歌声をもとに歌唱合成をして、新しい曲を歌ってもらうのを筆者はライフワークにしているのだが、音声合成もやってみたいと以前から考えていた。Open JTalkで自分の声を試してみたのもその勉強のためなのだが、503文はさすがに先が遠い話でなかなか進まない。だがコエステーションならば気軽に始められる。

 そんな気持ちで作り始めた妻のしゃべり声「とりちゃん」は、今は10文だけのコエレベル1。Macの歌唱合成ソフトUTAU-Synthでしゃべりかたを似せて音の高さや長さ、タイミングを調整し、スピーカーから流れる「声」をコエステーションアプリに送り込んでいる。

photo UTAU-Synthという歌唱合成アプリで課題文を読み上げる
photo 13分で出来上がった

 なくしてしまった声をまた聴けるかもしれない。そんな希望を持たせてくれた東芝デジタルソリューションズの人たちには感謝しかない。

 妻には「またそんなことして」と怒られるかもしれないけど。

 コエレベル1の「とりちゃん」は、たしかに妻っぽい声だ。数十光年離れたところにいてしばらく会えない人と亜空間遠距離通話をしている感じだと思えば多少のホワイトノイズも納得できる。

 とにかく、また声が聞けてうれしいよ。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.