Googleの画像生成AIが進化 「Nano Banana Pro」登場 言語・編集能力を大幅強化、4Kにも対応
米Googleは11月20日(現地時間)、新たなAI画像生成モデル「Nano Banana Pro」(Gemini 3 Pro Image)を発表した。同社の最新基盤モデル「Gemini 3 Pro」をベースにしており、キャラクターなどの一貫性を維持しながら、自然言語による指示で細部を修正できる編集機能など画像処理能力を大幅に強化した。
米Googleは11月20日(現地時間)、新たなAI画像生成モデル「Nano Banana Pro」(Gemini 3 Pro Image)を発表した。同社の最新基盤モデル「Gemini 3 Pro」をベースにしており、キャラクターなどの一貫性を維持しながら、自然言語による指示で細部を修正できる編集機能など画像処理能力を大幅に強化した。
Nano Banana Proでは、Gemini 3 Proの強力な推論性能、世界に関する知識などを用いることで、より正確でコンテキストに富んだビジュアルの生成を実現。一貫性を維持しながら複数のキャラクター・人物を登場させることも可能という。生成品質と処理速度も向上しており、最大4Kの生成に対応するほか、最適化されたニューラルエンジンにより、条件によっては約0.8秒で画像を生成できるという。
自然言語による編集では、カメラアングルの調整、フォーカスの変更、高度なカラーグレーディングの適用、さらにはシーンのライティングの変換(昼夜の変化やボケ効果の作成など)など、スタジオ品質のクリエイティブコントロールが可能。テキストのレンダリング性能も向上しており、モックアップやポスターに、より多様なテクスチャ、フォント、カリグラフィを用いて、より詳細なテキストを作成できる。強化された多言語推論機能により、複数の言語でテキストを生成したり、コンテンツをローカライズ・翻訳したりも可能という。
また、Google検索のナレッジベースに接続することで、レシピのスナップショットを作成したり、天気やスポーツのリアルタイム情報を画像として視覚化できるという。そのほか、データのインフォグラフィック化、手書きメモの図表への変換といった、アイデアの視覚化も強化されている。
Nano Banana Proは、Geminiアプリで「Thinking」モデルを選択し、画像の作成を選択すると利用できるようになる。無料ユーザーは一定量生成でき、Google AI Plus、Pro、Ultraはより多くの生成が可能という。また、Gemini APIとGoogle AI Studio、Google Antigravityのほか、AI映画制作ツール「Flow」にも展開。フレームやシーンをより正確に制御できるとしている。
なお、GoogleはNano Banana Proの提供に合わせ、画像が生成されたものか検証するツールの提供も開始。同社製AIで生成したコンテンツに埋め込まれるデジタルウォーターマーク「SynthID」を利用し、Geminiアプリに画像をアップロードするだけで判定できる。画像のほか、近く音声と動画にも対応するとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
次世代AIモデル「Gemini 3」、ついに登場 “空気を読む力”が向上 Google検索でも早速提供
米Googleは、次世代AIモデル「Gemini 3」を発表した。
Photoshop β版が「nano-banana」対応 「生成塗りつぶし」で他社モデル選べるように
Photoshop β版の「生成塗りつぶし」機能に利用できる生成AIモデルに、Googleの「Gemini 2.5 Flash Image」(通称nano-banana)などが追加。
バンダイ、“AIでフィギュア化”画像に注意喚起 「弊社商品と誤解を与えるような投稿は控えて」
バンダイとBANDAI SPIRITSは、生成AIでフィギュア風に加工した画像の一部に同社のロゴが表示されているとして、「画像は弊社商品ではない」と注意を呼び掛けた。
Google、画像生成AI「nano-banana」発表 画像内の人やモノの一貫性保つ性能強化 編集も自然言語で自在に
米Googleは、新たな画像生成AIモデル「Gemini 2.5 Flash Image」(通称:nano-banana)を発表した。前モデルに比べ、複数の画像を生成する際に画像内の人やモノの一貫性保持する機能や、自然言語の指示による画像編集の性能などを強化したという。










