このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
北京理工大学とUAEのInception Institute of Artificial Intelligence(IIAI)、米ジョージ・メイソン大学の研究チームが2019年11月に発表した新技術「Comic-Guided Speech Synthesis」は、漫画に登場するキャラクターが発するせりふを、適切な感情をこめた音声に変換し、出力する手法だ。
漫画本のページを読み込ませると、各キャラクターが発している吹き出しの中のせりふを分析し、ストーリーの流れに沿って音声を合成する仕組み。
分析と発話に当たっては、「Comic Visual Analysis」「Comic Speech Synthesis」の2つの技術を使用する。各技術の詳細は以下の通り。
これらの技術を用いることで、オーディオコミック制作の自動化、本から飛び出して話すARキャラクターの作成、話せる3Dアバターの生成、ゲームキャラクターのナレーション――など、さまざまな活用が可能になる。漫画とは異なる言語で音声を出力することで、外国語学習の手段としても利用できる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR