検索
ニュース

ChatGPTの「画像生成」、どう進化? 開発者に聞く “文字化け解消”の秘訣(2/2 ページ)

米OpenAIの画像生成AI「ChatGPT Images 2.0」はどのように進化したのか。ポイントを開発者に聞いた。

Share
Tweet
LINE
Hatena
前のページへ |       

“文字化け解消”の秘訣は

 ハタ氏によると、テキストレンダリング性能向上の裏には“地道な作業”があった。「社内に各言語に特化した担当者がおり、画像を作成して『これ、違うな』と思ったら、まずい部分にマークをして修正する。こうした作業を延々と反復した」(ハタ氏)

 ただし、日本語などに見られる縦書きについては、横書きの出力レベルには達していないという。今後、改善していく方針を示した。

 ハタ氏は、ChatGPT Images 2.0の設計思想について「あらゆるユースケースで使えるようにしたかった」と語る。「エンターテインメントなどのクリエイティブや、教育、B2B(法人向けビジネス)分野でも使えるようにした」(ハタ氏)

 一方、OpenAIを巡っては、動画生成AIアプリ「Sora」の終了を3月に発表するなど、エンタメ分野から一部撤退する姿勢も伺える。画像生成AIについて、どのような展望を持っているのか。ハタ氏は、エンタメ・ビジネス用途を問わず、ChatGPTで多くのユーザーが画像を作成している現状を踏まえ「今の状態のまま進化し続ける」と予測する。

 「『画像を生成する』というと、どうしても面倒なプロンプトを入れなきゃいけないと思われがちだが、見ていただいた通り、非常にシンプルなプロンプトであのレベルの画像を作成できる。例えばこの先、ユーザーのアシスタントが共同でプロンプトを入力することで、素晴らしい画像を作れるようになる。そんな進化をするのではないか」(ハタ氏)

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る