ニュース
漫画キャラのせりふを、感情のこもった音声合成に変換 北京理工大学などが新技術:Innovative Tech
漫画に登場するキャラクターのせりふから感情の状態を抜き出し、それに合わせた音声を生成する技術が開発された。
Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
北京理工大学とUAEのInception Institute of Artificial Intelligence(IIAI)、米ジョージ・メイソン大学の研究チームが2019年11月に発表した新技術「Comic-Guided Speech Synthesis」は、漫画に登場するキャラクターが発するせりふを、適切な感情をこめた音声に変換し、出力する手法だ。
漫画本のページを読み込ませると、各キャラクターが発している吹き出しの中のせりふを分析し、ストーリーの流れに沿って音声を合成する仕組み。
分析と発話に当たっては、「Comic Visual Analysis」「Comic Speech Synthesis」の2つの技術を使用する。各技術の詳細は以下の通り。
- Comic Visual Analysis:漫画本のページを分析し、パネル・吹き出し・テキストなどを抽出した上で、各要素を物語の順序に並べ替える。その上で、吹き出しと、せりふの主であるキャラクターをひもづける。続けて、各キャラクターの性別と年齢、せりふの内容と対応する感情(幸せ、悲しみ、怒りなど)を識別する。
- Comic Speech Synthesis:Comic Visual Analysisの分析に基づき、性別・年齢・感情と対応する、各キャラクターの音声を合成する。
これらの技術を用いることで、オーディオコミック制作の自動化、本から飛び出して話すARキャラクターの作成、話せる3Dアバターの生成、ゲームキャラクターのナレーション――など、さまざまな活用が可能になる。漫画とは異なる言語で音声を出力することで、外国語学習の手段としても利用できる。
関連記事
- 文字列を移動させ手書きメモを挿入 Microsoftなど「SpaceInk」開発
これからの電子校正は変わるかもしれない。MSなどが新しいアプローチを編み出した。 - 人差し指にQWERTYキーボードをかぶせ、片手で文字入力 米ダートマス大学など「TipText」開発
指サックのようなQWERTYキーボードを人差し指にかぶせ、親指でタッチして文字入力する。 - 文書画像のゆがみや明るさ、深層学習で補正 香港科技大学やMicrosoftなど開発
読み取りにくい書類を正しい姿に戻す技術が開発された。OfficeLensに採用されるとスキャンがはかどりそうだ。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.