検索
ニュース

Googleの画像生成AIが進化 「Nano Banana Pro」登場 言語・編集能力を大幅強化、4Kにも対応

米Googleは11月20日(現地時間)、新たなAI画像生成モデル「Nano Banana Pro」(Gemini 3 Pro Image)を発表した。同社の最新基盤モデル「Gemini 3 Pro」をベースにしており、キャラクターなどの一貫性を維持しながら、自然言語による指示で細部を修正できる編集機能など画像処理能力を大幅に強化した。

Share
Tweet
LINE
Hatena

 米Googleは11月20日(現地時間)、新たなAI画像生成モデル「Nano Banana Pro」(Gemini 3 Pro Image)を発表した。同社の最新基盤モデル「Gemini 3 Pro」をベースにしており、キャラクターなどの一貫性を維持しながら、自然言語による指示で細部を修正できる編集機能など画像処理能力を大幅に強化した。


「Nano Banana Pro」(Gemini 3 Pro Image)

 Nano Banana Proでは、Gemini 3 Proの強力な推論性能、世界に関する知識などを用いることで、より正確でコンテキストに富んだビジュアルの生成を実現。一貫性を維持しながら複数のキャラクター・人物を登場させることも可能という。生成品質と処理速度も向上しており、最大4Kの生成に対応するほか、最適化されたニューラルエンジンにより、条件によっては約0.8秒で画像を生成できるという。


14枚のキャラクター画像をもとに1枚の画像を生成

男性がドレスを持つ写真をもとに、ドレスの変更、家具の配置などを行う

5人の人物(+犬1匹)を一貫性を維持したまま1枚の画像に

 自然言語による編集では、カメラアングルの調整、フォーカスの変更、高度なカラーグレーディングの適用、さらにはシーンのライティングの変換(昼夜の変化やボケ効果の作成など)など、スタジオ品質のクリエイティブコントロールが可能。テキストのレンダリング性能も向上しており、モックアップやポスターに、より多様なテクスチャ、フォント、カリグラフィを用いて、より詳細なテキストを作成できる。強化された多言語推論機能により、複数の言語でテキストを生成したり、コンテンツをローカライズ・翻訳したりも可能という。


ライティングの変更

画像からストーリーボードの作成

単語の意味をインスピーレーションにフォントのスタイルを変更

「BERLIN」という文字が街の建物に溶け込む画像

缶の英語を韓国語に変更

 また、Google検索のナレッジベースに接続することで、レシピのスナップショットを作成したり、天気やスポーツのリアルタイム情報を画像として視覚化できるという。そのほか、データのインフォグラフィック化、手書きメモの図表への変換といった、アイデアの視覚化も強化されている。


1枚の写真からインフォグラフィックの作成

カルダモンティーの作り方をステップごとに作成したインフォグラフィック

 Nano Banana Proは、Geminiアプリで「Thinking」モデルを選択し、画像の作成を選択すると利用できるようになる。無料ユーザーは一定量生成でき、Google AI Plus、Pro、Ultraはより多くの生成が可能という。また、Gemini APIとGoogle AI Studio、Google Antigravityのほか、AI映画制作ツール「Flow」にも展開。フレームやシーンをより正確に制御できるとしている。

 なお、GoogleはNano Banana Proの提供に合わせ、画像が生成されたものか検証するツールの提供も開始。同社製AIで生成したコンテンツに埋め込まれるデジタルウォーターマーク「SynthID」を利用し、Geminiアプリに画像をアップロードするだけで判定できる。画像のほか、近く音声と動画にも対応するとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る