ニュース
ChatGPTの「画像生成」、どう進化? 開発者に聞く “文字化け解消”の秘訣(2/2 ページ)
米OpenAIの画像生成AI「ChatGPT Images 2.0」はどのように進化したのか。ポイントを開発者に聞いた。
“文字化け解消”の秘訣は
ハタ氏によると、テキストレンダリング性能向上の裏には“地道な作業”があった。「社内に各言語に特化した担当者がおり、画像を作成して『これ、違うな』と思ったら、まずい部分にマークをして修正する。こうした作業を延々と反復した」(ハタ氏)
ただし、日本語などに見られる縦書きについては、横書きの出力レベルには達していないという。今後、改善していく方針を示した。
ハタ氏は、ChatGPT Images 2.0の設計思想について「あらゆるユースケースで使えるようにしたかった」と語る。「エンターテインメントなどのクリエイティブや、教育、B2B(法人向けビジネス)分野でも使えるようにした」(ハタ氏)
一方、OpenAIを巡っては、動画生成AIアプリ「Sora」の終了を3月に発表するなど、エンタメ分野から一部撤退する姿勢も伺える。画像生成AIについて、どのような展望を持っているのか。ハタ氏は、エンタメ・ビジネス用途を問わず、ChatGPTで多くのユーザーが画像を作成している現状を踏まえ「今の状態のまま進化し続ける」と予測する。
「『画像を生成する』というと、どうしても面倒なプロンプトを入れなきゃいけないと思われがちだが、見ていただいた通り、非常にシンプルなプロンプトであのレベルの画像を作成できる。例えばこの先、ユーザーのアシスタントが共同でプロンプトを入力することで、素晴らしい画像を作れるようになる。そんな進化をするのではないか」(ハタ氏)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
OpenAI、健康支援機能「ChatGPT Health」発表 Apple「ヘルスケア」などと連携
OpenAIは、ChatGPTアプリの新機能「ChatGPT Health」を発表した。Appleの「ヘルスケア」アプリなどのデータにアクセスし、検査結果の解説や医師への相談準備を支援する。プライバシー対策として、通常のチャットとは隔離された専用メモリ空間を使用し、モデルの学習にも利用しない。現在はベータβ版のウェイトリスト登録を受け付けている。
OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗
OpenAIは、画像生成AIの新版「ChatGPT Images 1.5」を発表した。生成速度が最大4倍高速化し、指示追従性や写真編集能力、高密度なテキスト描画性能が大幅に向上。サイドバーには専用の「画像」メニューが追加され、直感的な操作が可能になった。無料版を含む全ユーザーに順次展開され、API利用料も従来より20%安価になる。
動画生成AI「Sora」ついに登場──OpenAIが提供 最大20秒の動画作成可能 ディープフェイク対策にも慎重
米OpenAIは12月9日(現地時間)、動画生成AI「Sora」を同日から提供すると発表した。
「Sora」に数秒の動画で独自キャラを生成できる「character cameos」
OpenAIは、Soraの新機能「character cameos」を発表した。自分のペットなどの短い動画からキャラクターを作成し、Soraの動画に挿入できる。権限設定も可能だ。複数クリップを結合する「stitching」機能も追加した。
OpenAI、人気のジブリ風画像生成機能をAPIで提供開始
OpenAIは、ジブリ風画像生成で話題のAIモデル「gpt-image-1」の、APIを通じての提供を開始した。すでに、AdobeやFigma、Canva、Quora、Instacartなどが利用している。