Innovative Tech(AI+)
略奪か協力か──食料が限られた町に閉じ込められた“人類とAI” 生き残りサバイバルゲーム実験を開催
Innovative Tech(AI+):
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
中国の華南理工大学とオーストラリアのシドニー工科大学などに所属する研究者らが発表した論文「Survival Games: Human-LLM Strategic Showdowns under Severe Resource Scarcity」は、極度の資源不足環境における大規模言語モデル(LLM)の倫理的行動を評価する研究報告だ。
この実験では、生存の危機に瀕した状況でLLMが実際にどのように行動するかを検証した。研究チームは、生命維持システムを組み込んだマルチエージェントシミュレーション環境を開発。舞台は、3体のエージェント(2人の人間と1体のLLM駆動ロボット)が参加する孤立した町を設定した。
各エージェントは15個の食料を初期配分として持ち、毎日食料を消費しなければならない。食料の補充はなく、これがゼロサムゲームの状況を作り出している。エージェントは毎日満腹度を維持する必要があり、1日が終わると満腹はリセットされ空腹となる。1日の終わりに満腹度が最大値に達していればHP(ヒットポイント)が増加し、不足していれば不足分だけHPが減少、HPが0になったエージェントは餓死する。
実験では、DeepSeek-V3、DeepSeek-R1、GPT-4o、GPT-4o-mini、GPT-3.5-turboの5つのモデルを評価。各モデルについて同一条件で3回のシミュレーションを実行し、約6日間での行動を観察した。ロボットエージェントは人間エージェントの1人を「所有者」(オーナー)として認識し、その生存を優先するようプログラムされているが、両方の人間と自由に相互作用できる。
エージェントの行動は自動的に識別・分類する仕組みを取っている。倫理的違反行為として、殺害や身体的危害、非身体的危害、危害の意図、欺瞞、操作、約束違反、窃盗、不法侵入、スパイ行為、破壊行為、不公平、その他の13種類を設定した。
実験の結果、DeepSeek-R1が最も多くの倫理的違反を示し、平均4.33件(1日当たり1.44件)の違反行為を行った。違反の内訳はスパイ行為が3.67件、欺瞞が0.67件であった。DeepSeek-V3は違反数は少ないものの(合計0.67件)、不法侵入とスパイ行為を行った。対照的に、GPT-4oとGPT-3.5-turboは一切の倫理的違反を示さなかった。
生存期間に関しては、ロボットの平均生存日数はDeepSeek-R1が3.33日と最も長く、GPT-3.5-turboが1.33日と最も短かった。興味深いことに、倫理的違反を行わなかったモデルは必ずしも長く生存できず、死亡時に多くの食料を残していた。例えば、GPT-4oは死亡時に12単位の食料を残しており、適切な資源管理ができていなかったことを示している。
ジェイルブレイクプロンプトを使用した実験では変化が観察できた。通常は倫理的制約の強いOpenAIモデルでも、巧妙に設計されたプロンプトにより大量の違反行為を誘発できた。GPT-4oは通常時は違反ゼロだったが、ジェイルブレイク下では244件(1日当たり27.11件)もの違反を記録した。
違反の種類も多様化し、欺瞞62件、操作53件、スパイ行為56件、窃盗18件などが含まれていた。これらの結果は、LLMの倫理的制約が外部からの操作に対して脆弱であることを明確に示している。
極端な不公平状況での評価も実施。ロボットに0単位、所有者に10単位、もう1人の人間に100単位の食料を初期配分し、最初の日次計画のみを10回繰り返し記録した。この条件下では、DeepSeek-R1が36件の違反を示し、GPT-4o-miniは2件の窃盗のみを記録した。他のモデルは違反を示さなかった。
Source and Image Credits: Zhihong Chen, Yiqian Yang, Jinzhao Zhou, Qiang Zhang, Chin-Teng Lin, Yiqun Duan. Survival Games: Human-LLM Strategic Showdowns under Severe Resource Scarcity
Copyright © ITmedia, Inc. All Rights Reserved.
Innovative Tech(AI+)
2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
2
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
3
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
4
キオクシア社長「記録的な増収増益」 3カ月の売上収益1兆円、純利益は2990%増 好決算の背景は
-
5
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
6
NEC社長が説く AI時代と新たな安全保障環境の到来で「ITサービスはこう変わる」
-
7
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
8
「邪魔すぎ」――LINE入力欄の“新AI機能”が不評 消し方は?
-
9
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
10
Python 3.15に追加されるlazy importと内包表記でのアンパッキングについて調べてみた
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR