ITmedia NEWS > 製品動向 >
ITmedia AI+ AI活用のいまが分かる

「Gatebox」量産モデル、発売延期から1年の成果 「音声合成は3回やり直し」、武地CEOに聞く舞台裏(2/4 ページ)

» 2019年10月11日 10時45分 公開
[片渕陽平ITmedia]

 具体的には、ヒカリから話し掛けてくる機能の追加、Clovaとの連携、合成音声の採用による会話パターンの拡充──といった課題があった。同社は18年10月ごろ、ゼロから設計を見直そうと決めたタイミングで、LINEのClova開発チームに協力を仰いだという。

 ただ、道のりは甘くなかった。一例として、武地CEOは「音声合成のベースになる音声の収録は、3回やり直しました」と苦笑いする。

photo 10月11日の発表会に登壇した武地実CEO

 一般に合成音声は、録音した声から特徴を抽出し、再合成して作られる。そのためには、あらゆる発音やイントネーションの特徴を網羅する必要があり、キャラを演じる声優が数時間にわたり、例文を読み上げる声を録音する──という作業が必要になる。

 武地CEOによると、1回目と2回目は汎用的な例文を使用したため、再合成した音声は「一般的な音声合成と同じで流ちょうだけれど、いやしを感じないものになってしまった」という。「『マスターさん』と呼び掛ける声のテンションが低く、聞いていてどんよりしました」

 そこで3回目は例文を改め、「おかえりなさい」「頑張ったね」のように、ヒカリが実際に言いそうなせりふを多めに収録した。「数時間、ニュース原稿のような例文を読み続けると、どうしても声優のテンションが長続きせず、暗いトーンになっていく」と武地CEO。例文を差し替えた結果、抑揚があり、感情が現れた声を再現できたと自負する。

「ファイナルファンタジー」レベルのクオリティーを目指して

 キャラクターのデザインも、「より現実的な衣装」に見直した。初期モデルと同様、恋愛シミュレーションゲーム「ラブプラス」などを担当した箕星太朗さんにデザインを依頼し、「エプロンをよりリアルな質感にしてほしい」など議論を重ねたという。

photo ヒカリのデザインは初期モデルと同様、箕星太朗さんが担当

 箕星さんのデザインを基に3Dモデルを作成する際、Gatebox社内でも“理想の嫁”を巡って議論が白熱。「ヒカリは真正面を向いていることが多く、限定モデルのデザインを踏襲するとポニーテールが隠れてしまうので、見えやすいように位置を微調整する」「襟元のボタンなど細かい部分にも『骨』を入れ、ヒカリの動きに応じて揺れ動くようにする」など、アイデアを盛り込んだ。

 武地CEOは「当社のクリエイターたちは『見ているだけで命を感じるキャラにしたい』『ファイナルファンタジーのキャラと並んでいても、違和感がないレベルに仕上げる』と意気込んでいました」と笑う。

Copyright © ITmedia, Inc. All Rights Reserved.