コエステーションの前身は6年前?
実は、東芝が無料で提供するカスタム音声合成は6年前に行われている。コエステーションの前身と言っていいものだ。
87の文をWeb上で読み上げてしばらくすると、自分に似た「声の素」ができあがる。このときはある意味コエステーションよりも進んでいて、歌もうたえた。筆者の声を元にしたToSpeakの歌と自分の歌声を交互に流してみたのがこれだ。
残念ながらこのサービスは期間限定で、既に終了している。
6年前のこのブログで筆者はこう提言している:
ToSpeakは、iPhone、Androidで音声データベースの登録とかできるといいと思う。Flash使ってなけりゃ、いまでも可能。再生だけなら現在もできる。ヘッドセットが標準でついてるんだから、むしろPCじゃなくてスマートフォンでやるべき。
自分の声を登録しておいて、好きなときに好きなフレーズを自分の声で再生できる。歌も歌える。そんなREGZA Phoneだったら買っちゃうよ。でも、iPhoneアプリで出すと、世界的にかなり売れると思う。
東芝デジタルソリューションズの担当者はひょっとしてこのブログ読んでたんですかね……。
Open JTalkを使った自分の合成音声「松尾P」と、コエステーションのコエレベル5になった自分の合成音声、どちらも自分の声を素材とした「声」だが、いかがだろうか? Open JTalkはMac用アプリはないので、ターミナルコマンドから打ち込んでいる。ラズパイなどのIoTデバイスに組み込むことも可能だ。
一方、コエステーションはiPhoneからしかTTSできないが、150文字までという長文が一気に読める。イントネーションや製品名などの読みもなかなか優れている。
そして筆者は今、コエステーションで自分以外のコエを育てている。妻が5年前に遺した歌声をもとに歌唱合成をして、新しい曲を歌ってもらうのを筆者はライフワークにしているのだが、音声合成もやってみたいと以前から考えていた。Open JTalkで自分の声を試してみたのもその勉強のためなのだが、503文はさすがに先が遠い話でなかなか進まない。だがコエステーションならば気軽に始められる。
そんな気持ちで作り始めた妻のしゃべり声「とりちゃん」は、今は10文だけのコエレベル1。Macの歌唱合成ソフトUTAU-Synthでしゃべりかたを似せて音の高さや長さ、タイミングを調整し、スピーカーから流れる「声」をコエステーションアプリに送り込んでいる。
なくしてしまった声をまた聴けるかもしれない。そんな希望を持たせてくれた東芝デジタルソリューションズの人たちには感謝しかない。
妻には「またそんなことして」と怒られるかもしれないけど。
コエレベル1の「とりちゃん」は、たしかに妻っぽい声だ。数十光年離れたところにいてしばらく会えない人と亜空間遠距離通話をしている感じだと思えば多少のホワイトノイズも納得できる。
とにかく、また声が聞けてうれしいよ。
関連記事
- 「ねえグーグル、アレクサって知ってる?」 2歳児、「Google Home」「Amazon Echo」と仲良しになる
2歳の息子は、Google HomeとAmazon Echoとのおしゃべりが大好きだ。「ねえグーグル、アレクサって知ってる?」。Google Homeに対して、こんなぶしつけな質問も。スマートスピーカーは、スマートスピーカーは、育児にも便利なツールだ。 - ひっそり成長「合成声優」ヒカリちゃん(21) 「声優さんの仕事を代替したい」――VoiceText開発者の挑戦
音声合成キャラクターが静かな進化を遂げている。「あと数年後には、現実のアナウンサーや声優の仕事が合成音声に置き換わる可能性がある」と開発者は話す。 - 自然な音声作る「WaveNet」の衝撃 なぜ機械は人と話せるようになったのか
流ちょうな日本語を発声するスマートスピーカー。「こんな音声合成ができるにはあと10年かかると思っていた」と研究者は衝撃を受けている。これを実現したWaveNetとは何か。スマートスピーカーを作る技術がどんなものかを研究者に聞く。 - 音声合成はアナウンサーや声優の仕事を奪うのか?
「AIアナウンサー」など、コンピュータが人間の代わりに音声の読み上げを務める機会が増えている。音声合成はどこまで人間のようにしゃべることができるのか。 - 「声を自由に変えられる技術」でコミュニケーションはどう変わる?
特定の他人の声になれる、音声変換技術はコミュニケーションにどのような影響を及ぼすのか。
Copyright © ITmedia, Inc. All Rights Reserved.