米Googleは8月28日（現地時間）、「Gemini」の画像生成機能に最新の画像生成モデル「Imagen 3」を導入すると発表した。無料版を含むすべてのGeminiで、日本語を含むすべての言語のユーザーが利用できるようになるとしている。モバイルアプリでも利用可能だが、本稿筆者の環境ではプロンプトは英語で入力する必要がある。

「太陽の光が差し込む草原で卵からかえった小さなドラゴンと、その周囲を光る好奇心旺盛なチョウが取り囲むアニメタッチの画像。鮮やかな色彩で、鱗は詳細に」というプロンプトで生成された画像例（画像：Google）

Pixel 9 Pro上のGeminiアプリで生成した画像

　Imagen 3は、今年のGoogle I/Oで発表された画像生成モデル。米国では「Pixel 9」シリーズの新アプリ「Pixel Studio」で利用可能になっている。

　Googleは2月、人物描画での批判を受けて人物画像生成機能を停止した。向こう数日中に、有料版Gemini（Gemini Advanced、Business、Enterprise）で人物画像の生成も再開するとしている。まずは英語でのプロンプトで利用可能になる見込みだ。

　同社は、「人物画像を生成する際のユーザー体験を大幅に向上させた。写実的で識別可能な人物、未成年者の描写、または過度に残酷で暴力的または性的なシーンの生成はサポートしない」というが、「他の生成AIツールと同様に、Geminiが生成するすべての画像が完璧になるわけではない」としている。

　Googleは同日、有料版Geminiで使えるオリジナルチャットbot生成機能「Gem」も発表した。

Google、有料版Geminiでオリジナルチャットbot作成機能「Gem」提供（日本語にも対応）
Googleは、「Gemini」をカスタマイズしてオリジナルチャットbotを作れる新機能「Gem」を有料版Gemini向けにリリースした。OpenAIが昨年11月にリリースしたChatGPTの「GPT」同様、botに役割を覚えさせることでプロンプトでの前提説明を省ける。
「Pixel 9」シリーズに、「Imagen 3」ベースのAI画像生成アプリ「Pixel Studio」
Googleは、「Pixel 9」シリーズに生成AI搭載の描画アプリ「Pixel Studio」を搭載すると発表した。「Tensor G4」と「Imagen 3」により、テキストから画像を生成する。
Google I/O 2024基調講演まとめ　AI一色、GPT-4oのような機能も
Googleの年次開発者会議「Google I/O」の基調講演で発表されたことをまとめた。ハードウェアについてはAIデータセンター向けのTPUのみで、Gemini中心の基調講演だった。
Geminiの画像生成機能が停止中　ダイバーシティ過剰適応問題対策で
Googleは、マルチモーダル生成AI「Gemini」での画像生成機能を一時的に停止している。「Geminiの画像生成に関する問題への対処に既に取り組んでいる。その間、人物の画像生成を一時停止し、改善版をすぐに再リリースする予定」としている。
Google、テキスト→画像生成AIモデル「Imagen 2」をVertex AIでリリース　画質大幅アップ
Googleは、テキストから画像を生成するAIモデル「Imagen 2」をGoogle Cloudのプラットフォーム「Vertex AI」で公開した。先代より画質が大幅アップし、レンダリングしたテキストを画像に貼り付けることなどが可能になった。