ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

AI記者、AI小説家、そしてAI作曲家も――創作する人工知能を支える技術よくわかる人工知能の基礎知識(4/5 ページ)

» 2019年10月07日 07時00分 公開
[小林啓倫ITmedia]

音声合成

 GANは画像だけでなく、音声データを生成する場合にも活用される。特に注目されているのは、音声モーフィングという自由に声をつくり変える技術だ。

 これはスタートアップの米Modulateが開発した、音声モーフィング技術のデモ映像。映像に登場しているのは創業者兼CEOのマイク・パパス氏で、その声がリアルタイムに変換され、幼い少年のような声や、女性の声へと次々に変っていく。最後には、オバマ元大統領そっくりの声まで再現されている。

 Modulateはこのリアルタイム音声変換技術を、誰もが利用できるサービスとして展開しようとしている。同社によれば、訓練用のデータが十分にあれば、誰の声でもコピーできるそうだ。

 そうなるとやはり悪用の不安が残るが、同社の技術を報じたMIT Technology Reviewによれば、Modulateは実在する人物の声のコピーを要求された場合、コピーされる人物の許可を得ていることを証明するよう求めるそうである。また自社技術で生成された声だと分かるように、音声データ内に「デジタル透かし」を入れる取り組みをしているそうだ。

 一方でこうした技術を活用することで、匿名での告発がしやすくなるのではないかという指摘もある。デジタルコンテンツの中で別人物として振る舞うことで、告発者は安全が守られる。ただ、容姿端麗な外見を作り出すことで説得力を不当に高める結果につながるのではないかなど、これらの技術に関しては常に賛否両論ある。

映像編集

 最後にAIによる映像編集の例を紹介したい。

 これはシンクロナイズド・スケーティングという、フィギュアスケート版シンクロナイズド・スイミングのような競技を捉えた映像だ。非常に滑らかなカメラワークで、競技内容やその性質をよく理解した上で被写体を追っているといえる。実はこの撮影を行ったのは、人間ではなくAIが制御するカメラだ。

Copyright © ITmedia, Inc. All Rights Reserved.