メディア

カテゴリ：

ネットの話題

コーナー：

セキュリティ

スタートアップ

ITmedia NEWS > STUDIO >

ITmedia AI＋ AI活用のいまが分かる

手軽にリアルな絵を生成　粗いマスク指定とテキスト入力で：Innovative Tech

» 2021年03月24日 07時41分公開

[山下裕毅，ITmedia]

Innovative Tech：

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

　スイス・チューリッヒ工科大学の研究チームが開発した「Controlling Style and Semantics in Weakly-Supervised Image Generation」は、ユーザーが手描きで大雑把に指定したマスク（画像処理ソフトなどで使われる領域指定）とテキスト記述や属性から、もっともらしいリアルな絵を生成する深層学習フレームワークだ。

セマンティックマップを利用してオブジェクトの形状やクラスを制御し、テキスト記述や属性を利用してローカルとグローバルの両方のスタイルを制御する

　手描きマスクからリアルな絵を生成する従来の技術には大規模なラベル付きデータが必要で、複雑な形状やオブジェクトから構成される絵の合成はできなかった。オブジェクトを削除すると不自然な部分が残ってしまう問題もあった。

　今回の手法では、オブジェクトの形状やクラスを制御するための大雑把な手描きマスクと、スタイルやテクスチャを制御するためのテキスト入力を組み合わせた新しいモデルを導入する。

　マスクを使った画像操作ではオブジェクトの形状やサイズ、移動、削除、追加などが実行でき、属性や自然言語による説明でシーンとそのオブジェクトの色や素材、天気、風景などのスタイルを制御できる。

　今回のフレームワークは、自動的に生成されたマスクを使用しラベルマップを作成している。なぜなら、セグメンテーションマスクに基づく弱教師あり学習と比較して、このプロセスは不自然なオブジェクトの発生が少なく、新しいデータセットでラベル付けする際に労力を抑えられるからだ。

本手法の2段階モデルによって生成されたデモ。入力のフルマスクに加えて、背景と前景に分解されたマスク、背景のみの出力結果、背景と前景を合成した出力結果、Ground truthを示す

本手法のアーキテクチャ。右が2つの生成器があるモデル

　学習したモデルを従来方式と比較した結果、実画像との類似性を評価するFIDスコアで、より高い数値を示した。

意味と属性の操作例。左端の列が入力画像、右端の列がGround truth、中央列が本手法の出力結果（Visual Genomeデータセットを使用）

テキストを用いたスタイル操作例。左端の列が入力画像、右端の列がGround truth、中央列が本手法の出力結果（COCOデータセットを使用）

関連記事

表と裏を独立検知できる布地タッチセンサー　Google、「ZebraSense」開発
表裏のセンサーを交互に組み込むことで、表からも裏からも操作可能。
協調して動く球体ロボット群「FreeBOT」　くっついたり離れたり、転がったり壁を登ったり
自律システムの構築も目指す。
レトロゲーム機でレトロゲームを自作　Microsoftが「TileCode」開発
「ツクール」など同種のものはあるが、今回はMSが構築した。

関連リンク

Controlling Style and Semantics in Weakly-Supervised Image Generation

Copyright © ITmedia, Inc. All Rights Reserved.

生成AIのビジネスユースケース一覧を見る

Special

PR

業務部門が抱える課題をITで解決（キーマンズネット）

RANKING

1

スーパーに並んだ「ごちゃごちゃ生成AIポップ」が物議　“看板王”こと、きぬた歯科院長「これはアリ」

2

Anthropic、「Claude Opus 5」公開　Fable 5に迫る性能を半額で――サイバー安全策は緩和、拒否時は自動フォールバックも

3

「人工甘味料」で脳の老化スピードが加速？　1.6年分の加齢差に相当　1万人超を調査、2025年に医学誌掲載

4

「人間洗濯機」が高齢者施設に　福祉の現場に万博技術導入　人手不足解消や産業成長に期待

5

“上下2階建てカメラ”の実力は？　「OsmoPocket 4P」は撮影の幅をぐっと広げたジンバルカメラだった

もっと読む »

アイティメディアからのお知らせ

キャリア採用の応募を受け付けています

SpecialPR

メールマガジンのお知らせ

ITmedia NEWSメールマガジン最新号テクノロジートレンドを週3配信

ご購読はこちら »

あなたにおすすめの記事PR

ITmediaはアイティメディア株式会社の登録商標です。

メディア一覧 | 公式SNS | 広告案内 | お問い合わせ | プライバシーポリシー | RSS | 運営会社 | 採用情報 | 推奨環境