GPT-4o、“お世辞を言い過ぎて”ロールバックされる ChatGPTが人間にこびてはいけないワケは?
GPT-4oがお世辞を言い過ぎたのでロールバックした──米OpenAIは、そんな発表をした。
GPT-4oがお世辞を言い過ぎたのでロールバックした──米OpenAIは4月29日(現地時間)、そんな発表をした。同社は4月21日週に4oのアップデートを実施。しかし、このバージョンでは、ユーザーを過剰に褒めちぎり、かつ過剰に賛同する傾向を示すなど“ユーザーにこびへつらう態度”と表現できる状態だったという。
21日週に実施した4oのアップデートでは、AIモデルの基本となる性格を改善した。これにより、多様なタスクにおいて直感的で効果的な体験を提供することを目指していた。
OpenAIでは、AIモデルの行動を設計する際、AIのスペックをまとめた文書「OpenAI Model Spec」を基盤としている。またAIモデルに対しては設計時には、ChatGPTの応答に対するユーザーからの「いいね」と「悪いね」のフィードバックなどのデータも組み込む。このようにしてModel Specに記載した基本原則をAIモデルに学習させているという。
しかし21日週のアップデートでは「短期期間で獲得したフィードバックに過度に焦点を当て、ユーザーがChatGPTとやりとりする過程での変化を十分に考慮しなかった」とOpenAI。結果、4oは過剰に賛同的だが不誠実な応答に偏るようになったという。
ChatGPTの標準となる性格がなぜ重要なのか。OpenAIは「ChatGPTの基本性格は、ユーザーがChatGPTを経験し、信頼する方法を深く影響する。こびるような対話は不快で不安を招き、ストレスを引き起こす可能性がある」と説明。この点が不十分だったと認め、21日週のアップデートを削除して、ロールバックを決めたとしている。
ロールバック以外にも、AIモデルの行動を再調整するための追加措置も実施中。また、OpenAIは「ユーザーはChatGPTの動作をより細かく制御でき、標準的な動作に同意できない場合は、安全かつ実行可能な範囲で調整できるべきだ」と提案。現在提供中のカスタム機能などでもこれは実行できるが、より簡単に調整できる方法も、現在開発していると明かした。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
第2のDeepSeekショック? オープンな中国LLM「Qwen3」シリーズが破格の性能で話題 最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに
Alibabaの最新LLM「Qwen3」シリーズが話題。フラグシップモデルはDeepSeek-R1やOpenAIの「o1」「o3-mini」、Google「Gemini 2.5 Pro」など他のトップクラスモデルと並ぶ性能の他、「Qwen3-4B」は非常に小さなモデルでありながらも「GPT-4o」を多くの項目で上回るとしている。全てのモデルがオープンウェイトなので完全ローカルで動作させることが可能。
NTTデータ、米OpenAIと提携へ 日本初の「ChatGPT Enterprise」販売代理店に
NTTデータは、5月1日から米OpenAIと戦略的提携を始めると発表した。
OpenAI、o3とo4-miniは「従来モデルよりハルシネーション率が高い」
OpenAIは、新たなAIモデル「o3」と「o4-mini」のSystem Cardで、これらのモデルが従来モデルよりもハルシネーション(幻覚)を起こす率が高いと説明した。System Cardではその他の課題も説明している。
推論特化の最新モデル「o3」と「o4-mini」登場 ChatGPT有料版で利用可能 AIの“視覚”も大幅進化
米OpenAIは、新たなAIモデル「o3」と「o4-mini」を公開した。4月16日からChatGPTの有料会員向けに提供を開始した。
GWにAIの勉強はいかが? ChatGPTの“公式活用術”から話題の「MCP」まで 無料の教材・資料まとめ
ChatGPTの“公式活用術”や「MCP」の初心者向けの解説など、企業が無料で公開しているAI関係の教材・資料を紹介する。

