マイページ

注目記事を集めた総合ページ

ITの今と未来を見通す

スマホと通信の最新トレンド

進化するPCとデバイスの未来

好きが集まる　比べて選べる

ビジネスと働き方のヒント

AI活用のいまが分かる

企業ITのトレンドを詳説

経営リーダーのコミュニティ

マーケ×ITの今がよく分かる

ITエンジニア向け専門サイト

企業向けIT製品の総合サイト

IT製品の技術・比較・事例

製造業のIT導入・活用を支援

モノづくり技術者専門サイト

エレクトロニクス専門サイト

電子設計の基本と応用

エネルギーの専門メディア

建設×テクノロジーの最前線

ちょっと気になるネットの話題

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣（1/2 ページ）

公開 2026年05月01日 17時50分

更新 2026年05月04日 09時11分

著者

[ITmedia]

印刷する

1
2

　画像生成AIにおける「パラダイムシフト（従来の考え方や価値観が大きく変化すること）になる」――米OpenAIの画像生成AI「ChatGPT Images 2.0」について、開発に携わった同社リサーチャーのハタ・ケンジ氏はこのように胸を張る。

　ChatGPT Images 2.0は、OpenAIが4月21日に発表したAIモデル。前世代から複数の性能を強化し、AIモデルの性能をユーザーが評価するWebサイト「Arena」（旧：LMArena）では、米Googleの画像生成AI「Nano Banana 2」を上回るスコアを獲得したという。ハタ氏に進化のポイントなどを聞いた。

ハタ・ケンジ氏（提供：OpenAI Japan、以下同）

　ハタ氏がまず挙げるのが、文字を画像として出力する「テキストレンダリング」性能の強化だ。日本語などローマ字以外の文字体系にも対応しており、細かい文字も乱れなく生成できるようにした。

　OpenAIの画像生成AIで初めて「Thinking機能」を備えたことも特徴だ。同機能は、出力の前に計画を立てることで、複雑なタスクに対応できるもの。Web検索でリアルタイムの情報を参照したり、1つの指示から複数枚の画像を生成したりできる。

　ハタ氏によると、生成画像を自ら見直して再出力する機能も持つという。「画像を生成し、その画像が正しいかどうか（AIモデル自身が）チェックする。もしAIモデルが画像を正しくないと考えれば、もう一度同じ作業を繰り返す」（ハタ氏）

　デモでは、英語で書かれた架空のメニュー表の画像を日本語表記にして見せた。Thinking機能により、画像内のテキストを読み込み、翻訳してから元の位置に戻すという複雑な作業ができるという。

英語の架空のメニューを

日本語版に

　「日光市（栃木県）を歩いているカップルの少しノスタルジックな画像を生成してください」と指示して出力した画像も披露した。ライティングや物の質感など「それほど長いプロンプトではないのに、細部に注意が払われている」（ハタ氏）とアピールした。

ノスタルジックな画像の例（1/3）

ノスタルジックな画像の例（2/3）

ノスタルジックな画像の例（3/3）

　なお、安全性についても対策したとハタ氏。出力結果には、データの来歴情報を管理する「C2PA」などを組み込んでおり、AI生成であることを識別できるようにしているという。AIを活用したモニタリングもしており、OpenAIのポリシーに違反する場合には対応するとした。

次ページへ “文字化け解消”の秘訣は

1
2

Copyright © ITmedia, Inc. All Rights Reserved.

印刷する

SpecialPR

この記事の著者

島田拓

関連記事

SpecialPR

メールマガジンを配信中

メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

メールマガジン最新号

「Kimi K3」のモデルウェイトと技術レポート公開　日本でも「NVIDIA B300×8」環境での利用報告 Anthropic、著作権訴訟で史上最大「2400億円」和解金支払いへ　学習利用は「フェアユース」認定／今週抑えるべき「Noetra本格始動」と「Kimi K3到来」

SpecialPR

よく見られているカテゴリー

アクセスランキング

もっと見る

SpecialPR

ITmedia AI＋ SNS

@itm_aiplusをフォロー

インフォメーション

注目情報をチェック

お問い合わせ

広告に関するお問い合わせ

ITmedia AI＋をフォロー

あなたにおすすめの記事PR