スタートアップのYellston(東京都港区)は9月7日、小学館と協力して、声優・森川智之さんの声を再現した音声合成AIが読み上げたオーディオブックを無償公開した。制作にはYellstonが手掛ける、ユーザーの声をAIで再現するサービス「CoeFont CLOUD」を活用。「小学館が進める、あらゆる出版物の音声化を目指す活動に協力した」(Yellston)という。
第一弾として、書籍「なぜ“ブブカ”はスポーツでもビジネスでも成功し続けるのか」の一部を読み上げたオーディオブックを期間限定で公開。音声は、森川さんの声を約2時間収録して集めたデータを活用して開発した。公開の終了時期は未定という。
CoeFont CLOUDは音声合成AIを活用し、ユーザーの声を500〜1500円で再現するサービス。作った音声を有料で公開し、収益を得られる機能も備えるが、今回作成した森川さんの音声は公開しないという。
森川さんは今回の音声について「まだまだ発展途上、点数を付ければ45点。細部にわたる表現力が課題で、100点には遠く及ばない。しかしAIが学習を重ねていけば、より理想とする表現に近づくだろう」としている。Yellstonは今後もCoeFont CLOUDを活用したオーディオブックを公開していく方針。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR