音声合成・歌声合成の新星「CeVIO」、その謎が解けた！（1/3 ページ）

» 2013年04月26日 19時55分公開

[松尾公也，ITmedia]

　等身大の3Dキャラクターが感情表現豊かに客と会話するデジタルサイネージが東京のアニメイト秋葉原で稼働している。キャラクターの名前は「さとうささら」。「CeVIO Vision」というシステムを使っている。

　4月26日午後6時には無償の音声合成・歌声合成アプリケーション「CeVIO Creative Studio FREE」も公開された。このCeVIOというプロジェクト、素性がただものではないことは分かるのだが、どこが主体でやっているのかは不明だった。ようやくその実体が判明した。

　稼働しているシステムをアニメイト秋葉原まで見に行ってみたが、MMDAgentを使った双方向音声デジタルサイネージである名古屋工業大学のバーチャル案内嬢「メイちゃん」と構成が似ている。真相を問い合わせみたが、もうちょっと待ってくれと言われて3カ月。ようやく取材が実現したのがつい先日のことだ。

徳田教授（左）と大浦特任助教

　話をうかがったのは、名古屋工業大学大学院の徳田恵一教授と大浦圭一郎特任助教。音声合成・歌声合成の権威である。徳田教授が率いるチームでは、HMM（隠れマルコフモデル）方式による音声合成システムを開発、オープンソース化して多くの企業などで使われているほか、無調教でリアルな歌声を作り出す歌唱合成サービスのSinsy、MikuMikuDance（MMD）モデルとモーションを使い人間と音声で会話できるMMDAgentなど、数多くの研究成果を持つ。

　「はい、あれはわれわれです。テクノスピーチという、名古屋工業大学の学内ベンチャーを設立し、そこでサポートとライセンシングをやっています」。

　やっぱり。

名工大で稼働しているMMDAgentのバーチャル案内嬢・メイちゃん

かなり大がかりなCeVIOプロジェクト

　名工大の国際音声技術研究所（徳田教授、李晃伸教授、大浦特任助教が中心）は音声に関するさまざまな技術を送り出してきた。オープンソースの音声認識エンジンであるJulius、隠れマルコフモデルによる音声合成システムHTS、それにMMD互換の3Dインタラクションを加えた双方向の音声インタラクションシステムMMDAgent、HTSを歌声合成に進化させ無調教で人間らしい歌声を出せるSinsyなどなど。

　これらは主としてオープンソース（BSDライセンス）で公開され、既に多くの企業のシステムやサービス、たとえば、NTTドコモの「しゃべってコンシェル」やAndroid 4.0以降の音声認識・音声合成にはこれらの技術の一部が使われている。

　しかし、それでは不十分だと感じた。オープンソースであるがゆえに、自由に使われて、学内で保有している優れたノウハウを付加したりアドバイスすることができない。進化のスピードも期待通りにいかない。「直接製品を届けたい」という気持ちもある。

　そのために、主要メンバー3人で2009年11月、「株式会社テクノスピーチ」を設立。これらの技術を商用利用するために必要とされるアドホックの処理、ビジネス上の技術などを提供できるという。サポート、ライセンシングを中心に活動している。音声や歌声のデータベースを作成する作業もここで行う。

　パートナー企業も加わった。メイちゃんを名古屋工業大学の正門に設置するのに協力したデジタルサイネージ専門企業ブイシンクと、アニメイトグループの1社、フロンティアワークスだ。さらに数社が協力してCeVIOプロジェクトを動かしている。

歌声も！

　　　　　　 1|2|3 次のページへ