GPT-4o、“お世辞を言い過ぎて”ロールバックされる ChatGPTが人間にこびてはいけないワケは?
GPT-4oがお世辞を言い過ぎたのでロールバックした──米OpenAIは4月29日(現地時間)、そんな発表をした。同社は4月21日週に4oのアップデートを実施。しかし、このバージョンでは、ユーザーを過剰に褒めちぎり、かつ過剰に賛同する傾向を示すなど“ユーザーにこびへつらう態度”と表現できる状態だったという。
21日週に実施した4oのアップデートでは、AIモデルの基本となる性格を改善した。これにより、多様なタスクにおいて直感的で効果的な体験を提供することを目指していた。
OpenAIでは、AIモデルの行動を設計する際、AIのスペックをまとめた文書「OpenAI Model Spec」を基盤としている。またAIモデルに対しては設計時には、ChatGPTの応答に対するユーザーからの「いいね」と「悪いね」のフィードバックなどのデータも組み込む。このようにしてModel Specに記載した基本原則をAIモデルに学習させているという。
しかし21日週のアップデートでは「短期期間で獲得したフィードバックに過度に焦点を当て、ユーザーがChatGPTとやりとりする過程での変化を十分に考慮しなかった」とOpenAI。結果、4oは過剰に賛同的だが不誠実な応答に偏るようになったという。
ChatGPTの標準となる性格がなぜ重要なのか。OpenAIは「ChatGPTの基本性格は、ユーザーがChatGPTを経験し、信頼する方法を深く影響する。こびるような対話は不快で不安を招き、ストレスを引き起こす可能性がある」と説明。この点が不十分だったと認め、21日週のアップデートを削除して、ロールバックを決めたとしている。
ロールバック以外にも、AIモデルの行動を再調整するための追加措置も実施中。また、OpenAIは「ユーザーはChatGPTの動作をより細かく制御でき、標準的な動作に同意できない場合は、安全かつ実行可能な範囲で調整できるべきだ」と提案。現在提供中のカスタム機能などでもこれは実行できるが、より簡単に調整できる方法も、現在開発していると明かした。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
6
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
7
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
10
光接続の標準規格「OCI」対応シリコン、GFが27年に投入
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR