メディア

カテゴリ：

速報

連載

コーナー：

ITmedia NEWS > AI+ >

NVIDIA、1枚の静止画で動きを合成　GANを用いた手法を開発　ダビデ像も踊り出す：Innovative Tech

» 2019年12月16日 17時16分公開

[山下裕毅，ITmedia]

Innovative Tech：

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

　NVIDIAが10月に発表した新技術は、映像内の動きを抽出して画像に転送することで、リアルな合成動画を生成する敵対的生成ネットワーク（Generative adversarial networks、GAN）を用いた手法だ。

　人の全身運動や顔の輪郭運動など、領域分割マスクや線画スケッチを基に、動かしたい画像に合成し写実的な映像に仕上げる。

　ベースとなる以前の研究「Video-to-video synthesis」（vid2vid）では、学習したドメインでしか合成できなかったが、今回の研究では訓練データセットに含まれてなくても合成が可能になり、より幅広い合成動画が作成できる。

左：以前の研究 vid2vidのメソッド、右：本提案手法のメソッド、学習していないドメインでも合成可能

　デモ映像では、いくかの転送事例が紹介されている。例えば、ダンスをする人のキーポイントを用いて複数の人へ転送する、さまざまな人に無理やりダンスさせる、ダビデ像などのモノへの転送も可能だ。

ダンスを転送させた様子、上段行が参照画像で、左列が全身の動きサンプルとなるキーポイント

さまざまなダンスをダビデ像に転送させた様子

　顔の動きを別の顔に転送する事例も発表された。無理やり顔の表情を動かす合成動画を作成できる。こちらも人の顔だけでなく、例えばモナリザへの転送も可能だ。

顔の動きを転送させた様子、上段行が参照画像、左列が顔の動きサンプル

さまざまな顔の動きをモナリザに転送させた様子

　最後に、マスク画像を用いて、車の前方に見える道路と街並みを転送する事例。さまざまな風景画像に、車から見える動きを転送する。

車から見える動きを転送させた様子

【編集履歴：2019年12月16日午後10時11分　本文の一部表現を変更しました】

体温で融ける金属で肌にフィット　変形するスマートウォッチ、韓国科学技術院が開発
YouTuberの紹介でも話題の体温で融ける金属を使うと、腕にぴったりフィットするウェアラブルを作ることができる。
人からロボットへ自然に手渡し、フェイントにも対応　ディズニーが技術開発
驚くほどスムーズな受け渡しが、人からロボットへ行われる。その仕組みとは……。

業務部門が抱える課題をITで解決（キーマンズネット）

アイティメディアからのお知らせ

キャリア採用の応募を受け付けています

SpecialPR

メールマガジンのお知らせ

ITmedia NEWSメールマガジン最新号テクノロジートレンドを週3配信

ご購読はこちら »

あなたにおすすめの記事PR

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

NVIDIA、1枚の静止画で動きを合成　GANを用いた手法を開発　ダビデ像も踊り出す：Innovative Tech

Innovative Tech：

関連記事

関連リンク

業務部門が抱える課題をITで解決（キーマンズネット）

RANKING

トノサマガエルは“スズメバチに刺されながら”捕食する──神戸大が研究発表　痛みや毒が通用しない……？

AWS、古いメインフレームを36mの高さから投下＆爆破　「技術負債を解消しよう！」

「風の谷のナウシカ」のメーヴェは、どこへ行く？　ラストフライトを終えた八谷和彦氏に聞く未来　【あさりよしとお著、まんが『無尾翼機のひみつ』公開中】

Geminiで業務AIエージェントが作れる　「Google Workspace Studio」提供開始　コーディング不要

クラウドフレアでまた障害　APIで問題　Zoomやメルカリなどつながりにくく【追記あり】

アイティメディアからのお知らせ

NVIDIA、1枚の静止画で動きを合成 GANを用いた手法を開発 ダビデ像も踊り出す：Innovative Tech

Innovative Tech：

関連記事

関連リンク

業務部門が抱える課題をITで解決（キーマンズネット）

RANKING

トノサマガエルは“スズメバチに刺されながら”捕食する──神戸大が研究発表 痛みや毒が通用しない……？

AWS、古いメインフレームを36mの高さから投下＆爆破 「技術負債を解消しよう！」

「風の谷のナウシカ」のメーヴェは、どこへ行く？ ラストフライトを終えた八谷和彦氏に聞く未来 【あさりよしとお著、まんが『無尾翼機のひみつ』公開中】

Geminiで業務AIエージェントが作れる 「Google Workspace Studio」提供開始 コーディング不要

クラウドフレアでまた障害 APIで問題 Zoomやメルカリなどつながりにくく【追記あり】

アイティメディアからのお知らせ

NVIDIA、1枚の静止画で動きを合成　GANを用いた手法を開発　ダビデ像も踊り出す：Innovative Tech

トノサマガエルは“スズメバチに刺されながら”捕食する──神戸大が研究発表　痛みや毒が通用しない……？

AWS、古いメインフレームを36mの高さから投下＆爆破　「技術負債を解消しよう！」

「風の谷のナウシカ」のメーヴェは、どこへ行く？　ラストフライトを終えた八谷和彦氏に聞く未来　【あさりよしとお著、まんが『無尾翼機のひみつ』公開中】

Geminiで業務AIエージェントが作れる　「Google Workspace Studio」提供開始　コーディング不要

クラウドフレアでまた障害　APIで問題　Zoomやメルカリなどつながりにくく【追記あり】