ニュース
素人がプロ並みに踊る動画を作れるGAN採用システムのデモ動画
カリフォルニア大学バークリー校の研究者らが「Everybody Dance Now」と題した論文とデモ動画を発表した。GANアルゴリズムを使い、素人がプロ並みのダンスを踊る動画を製作できる。
カリフォルニア大学バークリー校の研究者らは8月22日(現地時間)、「Everybody Dance Now」と題した論文を発表した。ディープラーニング技術により、素人がプロ並みのダンスを踊る動画を製作する方法を紹介している。
デモ動画(記事末に転載)を見ると、左上のプロのダンサーの動き(ソース動画)と同じ動きを素人(ターゲット)がなぞっている。
大まかな仕組みは、まずプロのダンス動画から動きを抽出するアルゴリズムを使い、針金人形のようなオブジェにその動きをトレースする。別途、素人のターゲットに幾つかの動きをさせ、録画する。そして、Generative Adversarial Networks(GAN、敵対的生成ネットワーク )と呼ばれるディープラーニングアルゴリズムを訓練し、ターゲットの動き全体と顔の表情を創造する。
GANは、教師なし機械学習のアルゴリズムの一種。生成ネットワークと識別ネットワークで構成され、これら2つの競合するネットワークのトレーニングを行うことでディープラーニングアルゴリズムの訓練に必要なデータ量を削減できる。
デモ動画にはところどころ不自然な動きやゆがみも見えるが、研究者らはこれらの問題を今後改善していくとしている。
関連記事
- AIであなたの動きを誰かが真似る、その仕組み
Googleが、普通の人にディープラーニングの面白さを紹介するWebサイトで「Move Mirror」を公開。PCのカメラの前で踊ってGIFとして録画すると、その隣に鏡のように同じポーズの老若男女の多様な画像が表示されるというものです。 - アイドル画像を自動生成するAI、京大発ベンチャーが開発
京都大学発のベンチャー、データグリッドが、架空のアイドルの顔画像を自動生成するAI技術を開発した。 - 静止画なのに回って見える AIも「錯視」 ディープラーニングで再現に成功
静止画にも関わらず、まるで動いているかのように見える「蛇の回転錯視」をディープラーニングマシンで再現したと日本の研究チームが発表。錯視をディープラーニングマシンで再現した世界初の事例という。 - Microsoft、テキストから画像を描く人工知能「AttnGAN」で見事な小鳥の絵
MicrosoftのAIラボが、自然言語テキストに基づいてゼロから画像を描く技術「AttnGAN」の論文を発表した。例えば「体が黄色で黒い羽を持ち、くちばしが短い鳥」というテキストからリアルな小鳥の画像を生成する。 - 「馬がシマウマに」「夏の写真が冬に」 “ペア画像なし”で機械学習するアルゴリズム「CycleGAN」がGitHubに公開
米バークレーAIリサーチラボラトリーと米カリフォルニア大学バークレー校の研究者が公開したアルゴリズムは、画像ペアのトレーニングデータがなくても学習・変換を可能にする。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.