GPT-4o、“お世辞を言い過ぎて”ロールバックされる　ChatGPTが人間にこびてはいけないワケは？

GPT-4oがお世辞を言い過ぎたのでロールバックした──米OpenAIは、そんな発表をした。

LINE

Hatena

　GPT-4oがお世辞を言い過ぎたのでロールバックした──米OpenAIは4月29日（現地時間）、そんな発表をした。同社は4月21日週に4oのアップデートを実施。しかし、このバージョンでは、ユーザーを過剰に褒めちぎり、かつ過剰に賛同する傾向を示すなど“ユーザーにこびへつらう態度”と表現できる状態だったという。

GPT-4o、“お世辞を言い過ぎて”ロールバックされる

　21日週に実施した4oのアップデートでは、AIモデルの基本となる性格を改善した。これにより、多様なタスクにおいて直感的で効果的な体験を提供することを目指していた。

　OpenAIでは、AIモデルの行動を設計する際、AIのスペックをまとめた文書「OpenAI Model Spec」を基盤としている。またAIモデルに対しては設計時には、ChatGPTの応答に対するユーザーからの「いいね」と「悪いね」のフィードバックなどのデータも組み込む。このようにしてModel Specに記載した基本原則をAIモデルに学習させているという。

　しかし21日週のアップデートでは「短期期間で獲得したフィードバックに過度に焦点を当て、ユーザーがChatGPTとやりとりする過程での変化を十分に考慮しなかった」とOpenAI。結果、4oは過剰に賛同的だが不誠実な応答に偏るようになったという。

　ChatGPTの標準となる性格がなぜ重要なのか。OpenAIは「ChatGPTの基本性格は、ユーザーがChatGPTを経験し、信頼する方法を深く影響する。こびるような対話は不快で不安を招き、ストレスを引き起こす可能性がある」と説明。この点が不十分だったと認め、21日週のアップデートを削除して、ロールバックを決めたとしている。

　ロールバック以外にも、AIモデルの行動を再調整するための追加措置も実施中。また、OpenAIは「ユーザーはChatGPTの動作をより細かく制御でき、標準的な動作に同意できない場合は、安全かつ実行可能な範囲で調整できるべきだ」と提案。現在提供中のカスタム機能などでもこれは実行できるが、より簡単に調整できる方法も、現在開発していると明かした。

OpenAIの発表ページから引用

GPT-4o、“お世辞を言い過ぎて”ロールバックされる　ChatGPTが人間にこびてはいけないワケは？

関連記事

関連リンク

GPT-4o、“お世辞を言い過ぎて”ロールバックされる ChatGPTが人間にこびてはいけないワケは？

関連記事

関連リンク

GPT-4o、“お世辞を言い過ぎて”ロールバックされる　ChatGPTが人間にこびてはいけないワケは？