自分の声で音声合成　OKIがソフト発売

» 2008年07月25日 07時00分公開

[宮本真希，ITmedia]

Polluxstar

　沖電気工業（OKI）は7月24日、自分の声から音声を合成し、入力したテキストを読み上げられる音声合成ソフト「Polluxstar」（ポルックスター）を発売した。あらかじめ録音しておいた自分の声のデータベースを元に音声を合成する仕組みだ。

　病気などで声を失った人に、自分の声の代わりとして使ってもらうといった用途を想定している。価格は音声データベース製作費用を含めて105万円。

「カスタム原稿」でイントネーションや方言も再現

Polluxstarの仕組み

　あらかじめ録音しておいた声を「音素」と呼ばれる細かい単位に分解してデータベースを作成。PC上で入力したテキスト通りの音素を抜き出して組み合わせ、音声を再生する。

　データベースを作る作業は、ユーザーの声の録音から始まる。同社が用意した自然文の原稿をユーザーに朗読してもらい、その声を録音。原稿の長さは1000文ほどで、読み上げると60分くらい。収録には2～3時間かかるという。

　原稿を方言のイントネーションで読んで録音すれば、そのイントネーション通りに読み上げられるという。家族の名前や会社名、よく使う言い回しなどを「カスタム原稿」として録音しておけば、ユーザー独特の口調を再現することも可能だ。

　録音した音声を音素単位で検索ができるよう加工すれば、データベースの完成だ。ソフトに搭載した音声合成エンジンが、入力されたテキストを音声に変換するために必要な音素をデータベースから検索し、つなぎ合わせて再生する。

　最短で約2週間で音声の加工が終了し、注文から約1カ月で完成品を受け取れる。対応OSはWindows XP／Vista。

Polluxstarで“口げんか”も

　合成した音声は、イントネーションが少しおかしなところもあったが、おおむねなめらかで、まるで目の前で人が話しているようだ。病気などで声を失う前に録音しておき、Polluxstarを使って自分の声でコミュニケーションしてもらう――といった利用法を想定している。

牧教授

　Polluxstarの製品化には、大阪芸術大学の牧泉教授が協力した。がんで声帯を切除することになっていた牧教授は、切除手術前にPolluxstarの技術を知り、声を録音。手術後はPolluxstarを使って家族と会話したり、大学の講義を行っている。Polluxstarを使って家族と口げんかすることもあるという

　牧教授からフィードバックを受け、音声品質やソフトのユーザーインタフェースを改良して製品化した。

　同社ユビキタスサービスプラットフォームカンパニーの平沼雄一郎プレジデントは「身近な人の声を聞くと『あの人だ』と分かるように、声は“本人性”を伝えるもの。Polluxstarは、本人性に着目して開発した。『あの声』でなければならないという思いに応えていきたい」と話す。

　Polluxstarという名前は、ふたご座の2つの明るい星のうち、弟の星「ポルックス」にちなんだ（兄はカストル）。仲のいい双子のように、自分の代わりに話してくれるソフトを作りたいという思いを込めたという。