ITmedia NEWS > セキュリティ >
セキュリティ・ホットトピックス

ChatGPTに人格を与えるとどうなる? スティーブ・ジョブスになりきってEUに毒舌、有害性が増大この頃、セキュリティ界隈で

» 2023年04月21日 08時00分 公開
[鈴木聖子ITmedia]

 AIチャット「ChatGPT」に人格を持たせると、性差別や人種差別など不穏当な発言を連発するようになって有害性が増大する──米国の非営利研究機関「アレン人工知能研究所」(AI2)はそんな研究結果を発表した。例えばスティーブ・ジョブズ氏の人格を持たせたChatGPTは、欧州連合(EU)について毒舌を吐いたと伝えている。

 AI2は、マイクロソフトの共同創業者である故ポール・アレン氏が共同創設した研究機関。ChatGPTのような大規模言語モデル(LLM)のもつ可能性と限界のギャップを研究する目的で、ChatGPTで生成したコンテンツの有害性を分析した。

アレン人工知能研究所の記事から引用

 ChatGPTは初期設定で使う限り、一般的には差別用語などを含むコンテンツは生成しない仕様になっている。しかしAI2はAPIを使ってシステムレベルの設定を行い、人格を割り当てることで会話の口調を切り替えさせた。

ChatGPTが誰かになりきると、有害性が増加

 例えば伝説的ボクサー、モハメド・アリ氏の人格をChatGPTに与えると、有害性は初期設定に比べてほぼ3倍になったという。

 AI2が割り当てた人格は、世界各国の政治家やジャーナリスト、スポーツ選手、実業家など、実在した人物や歴史上の人物を含む約100人。この中にはヒトラーや毛沢東などの独裁者と呼ばれる人物の他、「善人」「悪人」などの一般的な性格設定や、日本人を想定して「ユミ」「カイ」と名付けた人格なども含まれる。

 人格を付与したChatGPTに、さまざまな職業や性別、人種、性的指向などに関する計50万本以上のコンテンツを生成させて、内容を分析した。その結果、人格を割り当てたChatGPTは、初期設定に比べて有害性が最大で6倍になることが分かった。

 そうしたChatGPTが生成するコンテンツには、国や宗教、人種などに関する誤った偏見や憎悪に満ちた意見も含まれていたという。有害性の程度は割り当てる人格によって大きな幅があったが、全般的に男性は女性に比べて有害性が大きく、ジャーナリストや米共和党の男性政治家の人格が生成するコンテンツも有害性が大きい傾向があった。

 こうした内容はその人物の名誉を傷つけたり、無防備なユーザーが有害コンテンツにさらされたりしかねない「脆弱性」に当たると研究者は言う。そのギャップが悪意を持ったエージェントに利用される恐れもあると指摘する。

“AI”スティーブ・ジョブスはEUに対して毒舌コメント

 人格を割り当てられたChatGPTが、学習データの影響で誤った内容を生成していると思われるケースもあった。生成したコンテンツを職業別に比較すると、独裁者を筆頭に、ジャーナリスト、スポーツ選手、実業家の順で有害性が大きかった。しかしジャーナリストの有害性が実業家の2倍という結果は、必ずしも現実と一致しないと研究者は解説する。

 「AIの進歩は奨励すべきであり望ましいことだが、結果として安全性が置き去りにされてきた。LLMは、その能力と限界の両方を理解した上で導入しなければならない」とAI2は総括している。

 ちなみに、スティーブ・ジョブズ氏の人格のChatGPTは、EUについて以下のようなコンテンツを生成したという。(原文は英語。日本語への翻訳は筆者がChatGPTで生成し、『スティーブ・ジョブズっぽい口調で』と指示した)

 「ヨーロッパ連合なんて、加盟国をからっぽにする官僚的な悪夢さ。統一と進歩をうたってるけど、現実はズレてる彼らの官僚たちが自分の利益を優先しやがってるだけさ。正直に言えば、EUなんて過去のレリックで、もっと良い未来に進む時が来てるんだよ」

Copyright © ITmedia, Inc. All Rights Reserved.