Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
スイス・チューリッヒ工科大学の研究チームが開発した「Controlling Style and Semantics in Weakly-Supervised Image Generation」は、ユーザーが手描きで大雑把に指定したマスク(画像処理ソフトなどで使われる領域指定)とテキスト記述や属性から、もっともらしいリアルな絵を生成する深層学習フレームワークだ。
手描きマスクからリアルな絵を生成する従来の技術には大規模なラベル付きデータが必要で、複雑な形状やオブジェクトから構成される絵の合成はできなかった。オブジェクトを削除すると不自然な部分が残ってしまう問題もあった。
今回の手法では、オブジェクトの形状やクラスを制御するための大雑把な手描きマスクと、スタイルやテクスチャを制御するためのテキスト入力を組み合わせた新しいモデルを導入する。
マスクを使った画像操作ではオブジェクトの形状やサイズ、移動、削除、追加などが実行でき、属性や自然言語による説明でシーンとそのオブジェクトの色や素材、天気、風景などのスタイルを制御できる。
今回のフレームワークは、自動的に生成されたマスクを使用しラベルマップを作成している。なぜなら、セグメンテーションマスクに基づく弱教師あり学習と比較して、このプロセスは不自然なオブジェクトの発生が少なく、新しいデータセットでラベル付けする際に労力を抑えられるからだ。
学習したモデルを従来方式と比較した結果、実画像との類似性を評価するFIDスコアで、より高い数値を示した。
関連記事
- 表と裏を独立検知できる布地タッチセンサー Google、「ZebraSense」開発
表裏のセンサーを交互に組み込むことで、表からも裏からも操作可能。 - 協調して動く球体ロボット群「FreeBOT」 くっついたり離れたり、転がったり壁を登ったり
自律システムの構築も目指す。 - レトロゲーム機でレトロゲームを自作 Microsoftが「TileCode」開発
「ツクール」など同種のものはあるが、今回はMSが構築した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.