東北きりたん歌唱DBは、明治大学で音声合成の研究を行っている森勢将雅専任准教授のアイデアから生まれた。
18年10月、森勢准教授はTwitterで「統計的歌声合成用の歌唱データセットの収録をやらせてもらえないか」とツイート。それに目を付けたSSSがコンタクトをとり、制作が始まった。
SSSは東北きりたんの声を担当していた茜屋さんの声優事務所に企画書を持ち込んで、音声合成技術の基礎的な内容を説明しながら担当者を説得。その後は茜屋さんと収録スタジオのスケジュール調整に奔走したという。
収録したのは50曲。実際に声が出ている時間だけで1時間近い音声データになる。収録は5月。5回に分けて行ったため、スケジュール調整も複数回に及んだ。
収録後はAI開発などに必要となるデータの準備が続いた。音声に対応する楽譜データを作った他、1時間近くに及ぶ茜屋さんの音声ファイルに「○○秒から○○秒までが子音k、○○秒から○○秒までが母音a」と、全ての音素に印(ラベル)を付けていった。この作業は森勢准教授の研究室所属の学生が2人で半年掛けて行ったという。
最終的にSSSが歌唱DBをリリースしたのは、森勢准教授のツイートから1年以上たった19年11月中旬だった。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR