ニュース
» 2018年01月19日 09時48分 公開

Microsoft、テキストから画像を描く人工知能「AttnGAN」で見事な小鳥の絵

MicrosoftのAIラボが、自然言語テキストに基づいてゼロから画像を描く技術「AttnGAN」の論文を発表した。例えば「体が黄色で黒い羽を持ち、くちばしが短い鳥」というテキストからリアルな小鳥の画像を生成する。

[佐藤由紀子,ITmedia]

 米Microsoftの人工知能ラボMicrosoft Research AIは1月18日(現地時間)、自然言語のテキストの説明から画像を描くAIシステム「AttnGAN」を発表した。

 下図は、「体が黄色で黒い羽を持ち、くちばしが短い鳥」という説明から描き起こした画像という。

 gan 1

 Microsoftは「人間が検索エンジンBingで鳥を探せば鳥の絵を表示できる。だが、この(AIが描く)鳥の絵は、コンピュータがピクセルごとにゼロから描いたものだ。こうして描かれた鳥はリアルな世界には存在せず、コンピュータが思い描く鳥のイメージだ」と説明する。

 現在開発中のこのAI技術「Attentional Generative Adversarial Network(AttnGAN)」は、画像のキャプションのようなテキストによる描写の個々の単語に注意を払うようにプログラムされており、従来のテキストから画像を描く技術と比較して画質がほぼ3倍に向上したとしている。

 GANというのは、ディープラーニングの生成モデルの1つ。ジェネレータとディスクリミネータという2つのネットワークを使うことで、生成データを向上させていく。

 gan 2 AttnGANの概念図

 AttnGANの生成する画像はまだ不完全ではあるが、将来的には画家やインテリアデザイナーのアシスタント、音声による写真修正、さらには脚本から直接アニメ映画を作ることも可能になるかもしれないとMicrosoftはみている。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ

マーケット解説

- PR -