Microsoft、テキストから画像を描く人工知能「AttnGAN」で見事な小鳥の絵
MicrosoftのAIラボが、自然言語テキストに基づいてゼロから画像を描く技術「AttnGAN」の論文を発表した。例えば「体が黄色で黒い羽を持ち、くちばしが短い鳥」というテキストからリアルな小鳥の画像を生成する。
米Microsoftの人工知能ラボMicrosoft Research AIは1月18日(現地時間)、自然言語のテキストの説明から画像を描くAIシステム「AttnGAN」を発表した。
下図は、「体が黄色で黒い羽を持ち、くちばしが短い鳥」という説明から描き起こした画像という。
Microsoftは「人間が検索エンジンBingで鳥を探せば鳥の絵を表示できる。だが、この(AIが描く)鳥の絵は、コンピュータがピクセルごとにゼロから描いたものだ。こうして描かれた鳥はリアルな世界には存在せず、コンピュータが思い描く鳥のイメージだ」と説明する。
現在開発中のこのAI技術「Attentional Generative Adversarial Network(AttnGAN)」は、画像のキャプションのようなテキストによる描写の個々の単語に注意を払うようにプログラムされており、従来のテキストから画像を描く技術と比較して画質がほぼ3倍に向上したとしている。
GANというのは、ディープラーニングの生成モデルの1つ。ジェネレータとディスクリミネータという2つのネットワークを使うことで、生成データを向上させていく。
AttnGANの生成する画像はまだ不完全ではあるが、将来的には画家やインテリアデザイナーのアシスタント、音声による写真修正、さらには脚本から直接アニメ映画を作ることも可能になるかもしれないとMicrosoftはみている。
関連記事
- Microsoft、検索サービス「Bing」にAI機能 Redditとの提携も
MicrosoftがBingにディープニューラルネットワーク採用の「Intelligent Search」機能を追加し、最も信頼できる結果をカード状にしてページのトップに表示する。また、Redditとの提携により、サブレディットやAMAも表示する。 - Microsoft、視覚情報を音声で伝えるiPhoneアプリ「Seeing AI」公開
バーコードで製品の情報を読み取り、人の表情も伝えてくれる。 - Microsoft、人工知能ラボ「Microsoft Research AI」設立
Microsoftが、FacebookやGoogleが持つような人工知能専門ラボ「Microsoft Research AI」を立ち上げた。 - Google、プログラミングができなくてもAIツールを作れる「AutoML」のα版提供開始
Googleが、少量の教師データをアップロードして転移学習させるだけでAIツールを構築できる「Cloud AutoML」を発表した。まずは画像認識向けの「AutoML Vision」のα版を提供開始する。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.