Google「Gemini」の画像生成がハイレベルと話題に チャット1つで写真のアングルを違和感なく変更

 米Googleの大規模言語モデル「Gemini 2.0 Flash」が、3月12日(現地時間)に画像生成に対応した。テキストに加え画像の入力が可能で、例えば「この画像のアングルを変えて」「この画像に日本語で文字入れして」という指示にも対応する。XなどのSNSでは、出力物の精度の高さに感心する声が相次いでいる。

チャットで画像修正(画像はGoogle公式ブログより)
【画像】記者が試した結果は……【全5枚】

 リリース後から、Xではこの画像生成機能を試したユーザーの投稿が続出。画像内の物体の削除/追加やカラーリング、背景の変更などがチャットによる短い指示でできたとの報告が出ている。他にも正面を向いている人物を横から映すといったカメラアングルの移動や、画像内に日本語を正確に入力ができたとする投稿も。その手軽さと性能から「衝撃的」「マンガ制作に使えるのでは」などの意見も見られる。

 記者が試したところ、画像内の物体の削除や日本語の追加といった編集が、チャットの指示でできた。カメラアングルの変更も、ゆがみが生じるケースもあったが、大幅な移動に成功。加えて、ラーメンの器を空にした後、器の底に日本語を印刷するといった編集もできた。

画像内の物体を削除
アングルの変更
アングル変更の失敗例
日本語の追加

 Gemini 2.0 Flashの画像生成機能は、開発者向けにリリースしたもので、正式版ではない。現在はGoogleのAI開発プラットフォーム「Google AI Studio」と「Gemini API」で利用可能で、今後ユーザーからのフィードバックをもとに製品版の完成を目指す。

印刷する
SNSでシェア

この記事の著者

島田拓

島田拓

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR