米Googleは8月28日(現地時間)、「Gemini」の画像生成機能に最新の画像生成モデル「Imagen 3」を導入すると発表した。無料版を含むすべてのGeminiで、日本語を含むすべての言語のユーザーが利用できるようになるとしている。モバイルアプリでも利用可能だが、本稿筆者の環境ではプロンプトは英語で入力する必要がある。
「太陽の光が差し込む草原で卵からかえった小さなドラゴンと、その周囲を光る好奇心旺盛なチョウが取り囲むアニメタッチの画像。鮮やかな色彩で、鱗は詳細に」というプロンプトで生成された画像例(画像:Google)Imagen 3は、今年のGoogle I/Oで発表された画像生成モデル。米国では「Pixel 9」シリーズの新アプリ「Pixel Studio」で利用可能になっている。
Googleは2月、人物描画での批判を受けて人物画像生成機能を停止した。向こう数日中に、有料版Gemini(Gemini Advanced、Business、Enterprise)で人物画像の生成も再開するとしている。まずは英語でのプロンプトで利用可能になる見込みだ。
同社は、「人物画像を生成する際のユーザー体験を大幅に向上させた。写実的で識別可能な人物、未成年者の描写、または過度に残酷で暴力的または性的なシーンの生成はサポートしない」というが、「他の生成AIツールと同様に、Geminiが生成するすべての画像が完璧になるわけではない」としている。
Googleは同日、有料版Geminiで使えるオリジナルチャットbot生成機能「Gem」も発表した。
Google、有料版Geminiでオリジナルチャットbot作成機能「Gem」提供(日本語にも対応)
「Pixel 9」シリーズに、「Imagen 3」ベースのAI画像生成アプリ「Pixel Studio」
Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も
Geminiの画像生成機能が停止中 ダイバーシティ過剰適応問題対策で
Google、テキスト→画像生成AIモデル「Imagen 2」をVertex AIでリリース 画質大幅アップCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR