ハタ氏によると、テキストレンダリング性能向上の裏には“地道な作業”があった。「社内に各言語に特化した担当者がおり、画像を作成して『これ、違うな』と思ったら、まずい部分にマークをして修正する。こうした作業を延々と反復した」(ハタ氏)
ただし、日本語などに見られる縦書きについては、横書きの出力レベルには達していないという。今後、改善していく方針を示した。
ハタ氏は、ChatGPT Images 2.0の設計思想について「あらゆるユースケースで使えるようにしたかった」と語る。「エンターテインメントなどのクリエイティブや、教育、B2B(法人向けビジネス)分野でも使えるようにした」(ハタ氏)
一方、OpenAIを巡っては、動画生成AIアプリ「Sora」の終了を3月に発表するなど、エンタメ分野から一部撤退する姿勢も伺える。画像生成AIについて、どのような展望を持っているのか。ハタ氏は、エンタメ・ビジネス用途を問わず、ChatGPTで多くのユーザーが画像を作成している現状を踏まえ「今の状態のまま進化し続ける」と予測する。
「『画像を生成する』というと、どうしても面倒なプロンプトを入れなきゃいけないと思われがちだが、見ていただいた通り、非常にシンプルなプロンプトであのレベルの画像を作成できる。例えばこの先、ユーザーのアシスタントが共同でプロンプトを入力することで、素晴らしい画像を作れるようになる。そんな進化をするのではないか」(ハタ氏)
OpenAI、健康支援機能「ChatGPT Health」発表 Apple「ヘルスケア」などと連携
OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗
動画生成AI「Sora」ついに登場──OpenAIが提供 最大20秒の動画作成可能 ディープフェイク対策にも慎重
「Sora」に数秒の動画で独自キャラを生成できる「character cameos」
OpenAI、人気のジブリ風画像生成機能をAPIで提供開始Copyright © ITmedia, Inc. All Rights Reserved.