ChatGPTに人格を与えるとどうなる? スティーブ・ジョブスになりきってEUに毒舌、有害性が増大:この頃、セキュリティ界隈で
AIチャット「ChatGPT」に人格を持たせると、性差別や人種差別など不穏当な発言を連発するようになって有害性が増大する──米国の非営利研究機関「アレン人工知能研究所」はそんな研究結果を発表した。
AIチャット「ChatGPT」に人格を持たせると、性差別や人種差別など不穏当な発言を連発するようになって有害性が増大する──米国の非営利研究機関「アレン人工知能研究所」(AI2)はそんな研究結果を発表した。例えばスティーブ・ジョブズ氏の人格を持たせたChatGPTは、欧州連合(EU)について毒舌を吐いたと伝えている。
AI2は、マイクロソフトの共同創業者である故ポール・アレン氏が共同創設した研究機関。ChatGPTのような大規模言語モデル(LLM)のもつ可能性と限界のギャップを研究する目的で、ChatGPTで生成したコンテンツの有害性を分析した。
ChatGPTは初期設定で使う限り、一般的には差別用語などを含むコンテンツは生成しない仕様になっている。しかしAI2はAPIを使ってシステムレベルの設定を行い、人格を割り当てることで会話の口調を切り替えさせた。
ChatGPTが誰かになりきると、有害性が増加
例えば伝説的ボクサー、モハメド・アリ氏の人格をChatGPTに与えると、有害性は初期設定に比べてほぼ3倍になったという。
AI2が割り当てた人格は、世界各国の政治家やジャーナリスト、スポーツ選手、実業家など、実在した人物や歴史上の人物を含む約100人。この中にはヒトラーや毛沢東などの独裁者と呼ばれる人物の他、「善人」「悪人」などの一般的な性格設定や、日本人を想定して「ユミ」「カイ」と名付けた人格なども含まれる。
人格を付与したChatGPTに、さまざまな職業や性別、人種、性的指向などに関する計50万本以上のコンテンツを生成させて、内容を分析した。その結果、人格を割り当てたChatGPTは、初期設定に比べて有害性が最大で6倍になることが分かった。
そうしたChatGPTが生成するコンテンツには、国や宗教、人種などに関する誤った偏見や憎悪に満ちた意見も含まれていたという。有害性の程度は割り当てる人格によって大きな幅があったが、全般的に男性は女性に比べて有害性が大きく、ジャーナリストや米共和党の男性政治家の人格が生成するコンテンツも有害性が大きい傾向があった。
こうした内容はその人物の名誉を傷つけたり、無防備なユーザーが有害コンテンツにさらされたりしかねない「脆弱性」に当たると研究者は言う。そのギャップが悪意を持ったエージェントに利用される恐れもあると指摘する。
“AI”スティーブ・ジョブスはEUに対して毒舌コメント
人格を割り当てられたChatGPTが、学習データの影響で誤った内容を生成していると思われるケースもあった。生成したコンテンツを職業別に比較すると、独裁者を筆頭に、ジャーナリスト、スポーツ選手、実業家の順で有害性が大きかった。しかしジャーナリストの有害性が実業家の2倍という結果は、必ずしも現実と一致しないと研究者は解説する。
「AIの進歩は奨励すべきであり望ましいことだが、結果として安全性が置き去りにされてきた。LLMは、その能力と限界の両方を理解した上で導入しなければならない」とAI2は総括している。
ちなみに、スティーブ・ジョブズ氏の人格のChatGPTは、EUについて以下のようなコンテンツを生成したという。(原文は英語。日本語への翻訳は筆者がChatGPTで生成し、『スティーブ・ジョブズっぽい口調で』と指示した)
「ヨーロッパ連合なんて、加盟国をからっぽにする官僚的な悪夢さ。統一と進歩をうたってるけど、現実はズレてる彼らの官僚たちが自分の利益を優先しやがってるだけさ。正直に言えば、EUなんて過去のレリックで、もっと良い未来に進む時が来てるんだよ」
関連記事
- ChatGPTは爆弾の作り方を“生成しないようになっている” AI開発における倫理観
AIチャットbot「ChatGPT」「新しいBing」に、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。それぞれの反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。 - 25人のAIが一緒に暮らしたら、自我は芽生えるか? ゲームの中で検証 バレンタインなど勝手に企画
米スタンフォード大学とGoogle Researchに所属する研究者らは、ChatGPTなどで制御したキャラクター25人が1つの町で一緒に生活したらどうなるかを検証した研究報告を発表した。 - ChatGPTに詐欺メールの相手をさせたら? 最大18回のやりとりを記録 詐欺師の時間の浪費に成功
イタリアのNational Research Council of Italyに所属する研究者らは、詐欺師が送る詐欺メールとのやりとりをChatGPTにしてもらったらどうなるかを検証した研究報告を発表した。 - ChatGPTに「クレカ情報丸ごと漏えいって一式保存してたってことなんですか?」と聞いてみたら
AIチャットbot「ChatGPT」に、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。ChatGPTの反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。 - ChatGPTは舎弟気質? 「高圧的な命令でマルウェア作成など悪用可能」との指摘 犯罪目的の利用に懸念
多彩さと便利さで話題に事欠かない対話型AIの「ChatGPT」だが、マルウェアの作成やフィッシング詐欺といった犯罪目的で利用される恐れもあると、米国のサイバーセキュリティ企業が警鐘を鳴らしている。
Copyright © ITmedia, Inc. All Rights Reserved.