ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

Google、「Gemini」の画像生成機能を「Imagen 3」に 人物描画も“間もなく”

» 2024年08月29日 09時11分 公開
[佐藤由紀子ITmedia]

 米Googleは8月28日(現地時間)、「Gemini」の画像生成機能に最新の画像生成モデル「Imagen 3」を導入すると発表した。無料版を含むすべてのGeminiで、日本語を含むすべての言語のユーザーが利用できるようになるとしている。モバイルアプリでも利用可能だが、本稿筆者の環境ではプロンプトは英語で入力する必要がある。

 imagen 1 「太陽の光が差し込む草原で卵からかえった小さなドラゴンと、その周囲を光る好奇心旺盛なチョウが取り囲むアニメタッチの画像。鮮やかな色彩で、鱗は詳細に」というプロンプトで生成された画像例(画像:Google)
 imagen 2 Pixel 9 Pro上のGeminiアプリで生成した画像

 Imagen 3は、今年のGoogle I/Oで発表された画像生成モデル。米国では「Pixel 9」シリーズの新アプリ「Pixel Studio」で利用可能になっている。

 Googleは2月、人物描画での批判を受けて人物画像生成機能を停止した。向こう数日中に、有料版Gemini(Gemini Advanced、Business、Enterprise)で人物画像の生成も再開するとしている。まずは英語でのプロンプトで利用可能になる見込みだ。

 同社は、「人物画像を生成する際のユーザー体験を大幅に向上させた。写実的で識別可能な人物、未成年者の描写、または過度に残酷で暴力的または性的なシーンの生成はサポートしない」というが、「他の生成AIツールと同様に、Geminiが生成するすべての画像が完璧になるわけではない」としている。

 Googleは同日、有料版Geminiで使えるオリジナルチャットbot生成機能「Gem」も発表した。

Copyright © ITmedia, Inc. All Rights Reserved.