GPT-4oがお世辞を言い過ぎたのでロールバックした──米OpenAIは4月29日(現地時間)、そんな発表をした。同社は4月21日週に4oのアップデートを実施。しかし、このバージョンでは、ユーザーを過剰に褒めちぎり、かつ過剰に賛同する傾向を示すなど“ユーザーにこびへつらう態度”と表現できる状態だったという。
21日週に実施した4oのアップデートでは、AIモデルの基本となる性格を改善した。これにより、多様なタスクにおいて直感的で効果的な体験を提供することを目指していた。
OpenAIでは、AIモデルの行動を設計する際、AIのスペックをまとめた文書「OpenAI Model Spec」を基盤としている。またAIモデルに対しては設計時には、ChatGPTの応答に対するユーザーからの「いいね」と「悪いね」のフィードバックなどのデータも組み込む。このようにしてModel Specに記載した基本原則をAIモデルに学習させているという。
しかし21日週のアップデートでは「短期期間で獲得したフィードバックに過度に焦点を当て、ユーザーがChatGPTとやりとりする過程での変化を十分に考慮しなかった」とOpenAI。結果、4oは過剰に賛同的だが不誠実な応答に偏るようになったという。
ChatGPTの標準となる性格がなぜ重要なのか。OpenAIは「ChatGPTの基本性格は、ユーザーがChatGPTを経験し、信頼する方法を深く影響する。こびるような対話は不快で不安を招き、ストレスを引き起こす可能性がある」と説明。この点が不十分だったと認め、21日週のアップデートを削除して、ロールバックを決めたとしている。
ロールバック以外にも、AIモデルの行動を再調整するための追加措置も実施中。また、OpenAIは「ユーザーはChatGPTの動作をより細かく制御でき、標準的な動作に同意できない場合は、安全かつ実行可能な範囲で調整できるべきだ」と提案。現在提供中のカスタム機能などでもこれは実行できるが、より簡単に調整できる方法も、現在開発していると明かした。
第2のDeepSeekショック? オープンな中国LLM「Qwen3」シリーズが破格の性能で話題 最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに
NTTデータ、米OpenAIと提携へ 日本初の「ChatGPT Enterprise」販売代理店に
OpenAI、o3とo4-miniは「従来モデルよりハルシネーション率が高い」
推論特化の最新モデル「o3」と「o4-mini」登場 ChatGPT有料版で利用可能 AIの“視覚”も大幅進化
GWにAIの勉強はいかが? ChatGPTの“公式活用術”から話題の「MCP」まで 無料の教材・資料まとめCopyright © ITmedia, Inc. All Rights Reserved.