Google、画像プロンプトで画像をリミックス生成する「Whisk」
Googleは、新しい画像生成AIツール「Whisk」を発表した。被写体、シーン、スタイルの3つの画像をドラッグ&ドロップするとそれらをリミックスした画像を生成する。まずは米国向けにGoogle Labsで公開した。
米Googleは12月16日(現地時間)、画像を入力することで画像を生成する新しい生成AIツール「Whisk」を発表した。
米国在住のユーザーは、Google LabsのサイトでWhiskを試すことができる。
Whiskは、テキストではなく画像を使用してプロンプトを作成できるGoogle Labsの実験プロジェクト。Subject(被写体)、Scene(シーン)、Style(スタイル)の3つの画像をドラッグ&ドロップして“リミックス”し、独自の画像を作成できる。テキストプロンプトで説明を補足することも可能だ。
Whiskは、Googleの生成AI「Gemini」を使用して画像の詳細なキャプションを自動的に記述し、それをGoogleの画像生成モデル「Imagen 3」に入力する。
Whiskは、画像からいくつかの主要な特徴のみを抽出するため、期待とは異なる画像が生成される場合がある。例えば、生成された被写体の身長、体重、髪型、肌の色が異なる場合がある。その場合は、プロンプトを編集することで修正できる。
GoogleはWhiskを、従来の画像エディターではなく、新しいタイプのクリエイティブツールと位置付けている。ピクセル単位の完璧な編集ではなく、「迅速な視覚的探索のためのツール」であり、新しい創造的な方法でアイデアを探り、数十のオプションを試して、気に入ったものをダウンロードできるツールだとしている。
ちなみに、whiskは泡だて器という意味だ。3つの画像を泡だて器でミックスするイメージなのだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Googleドキュメント、AI画像の生成が可能に Geminiの「Imagen 3」で
「Googleドキュメント」上に、生成AI「Gemini」を使った画像を生成・挿入できる機能がリリース。
Google検索結果の「この画像について」にC2PAの来歴技術導入へ
Googleは、Google検索結果の画像の生成AI利用透明化を目指し、「この画像について」に標準化団体C2PAの技術を導入する。Googleは2月にC2PAに参加した。将来的には広告やYouTubeにも導入する計画だ。
Google、「Gemini」の画像生成機能を「Imagen 3」に 人物描画も“間もなく”
Googleは、「Gemini」の画像生成機能に最新モデル「Imagen 3」を導入すると発表した。無料ユーザーも利用可能だ。また、有料ユーザー向けに間もなく人物描画機能を再開するとしている。
米Google、動画生成AI「Veo 2」発表 最大4Kの解像度に対応 性能評価は米OpenAIの「Sora」超え
米Googleは、動画生成AI「Veo 2」を発表した。最大4Kの解像度で数分尺の動画を作成できる。米Metaのベンチマーク「MovieGenBench」で他の動画生成AIと性能を比べたところ、米OpenAIの動画生成AI「Sora Turbo」などよりも高い性能を記録したとしている。


