ITmedia NEWS > STUDIO >
インタビュー
» 2020年07月14日 07時00分 公開

萌えキャラを腐らせたくない 「東北ずん子」運営会社がAI向け学習データを無料公開、その狙いは (5/5)

[谷井将人,ITmedia]
前のページへ 1|2|3|4|5       

次の挑戦は「女の子の声になるにはどうしたらいいのか」

 これまでの歌唱DBに続く新たな取り組みも始まっている。SSSは7月7日、新たな機械学習向けDBの制作に向けたクラウドファンディングを始めた。作りたいのは、人が言葉を発している際の口の動きと音声をセットにした音声合成DBだ。

photo

 小田社長は、この音声合成DBが構築できれば、人が言葉を発している様子を収めた無音の動画を入力すると、読唇術のように口の動きを読み取って、キャラクターの音声を合成するシステムができるのではないかと考えている。

 口の動きに合わせて音声を合成する手法は、英オックスフォード大学や九州工業大学などが研究を進めている技術で、手術などで声帯を失い、声を出せなくなった人が再び声を出す技術として期待されている。映像に写る口の動きから発話内容を推定する精度は80%から90%と、研究途上にある。

 この技術は自身の姿を変えて楽しむようなコンテンツと相性がいい。小田社長はそう考えている。動画共有アプリ「TikTok」の映像加工技術や、アバターを身に付けてコミュニケーションできるVRアプリなど、見た目を変える技術は既に登場しているが、音声はまだ発展途上にあるからだ。「美少女になりたいというのは人類全体の希望だと思う」(小田社長)

 今後もSSSはクラウドファンディングで資金を集め、大学や声優事務所と連携しながら歌唱DBや読唇術DBの制作して研究者などに無料で公開する予定だ。クオリティーの高い学習データは、大学の研究者だけでなく個人の開発者も刺激し、NEUTRINOや個人の創作のようなムーブメントがまた巻き起こりそうだ。

前のページへ 1|2|3|4|5       

Copyright © ITmedia, Inc. All Rights Reserved.