AIエージェント「OpenClaw」がメールを全削除している──MetaのAI研究者、Mac Miniまで全力ダッシュ
AIが言うことを聞かず、Gmailの受信トレイの中身を削除されてしまったこと──米MetaのAI研究者が遭遇した危機とは。
「OpenClawが受信トレイを猛スピードで全削除していくのをただ眺めるしかない。これほどまでに自分をへこませる経験はない。スマホからは止められなかった。爆弾を解体するように、必死にMac Miniまで走った」──米MetaでAIの安全性やアライメント(AI倫理)を研究するサマー・ユエ氏は2月23日、自身のXアカウントにこう投稿した。AIが言うことを聞かず、Gmailの受信トレイの中身を削除されてしまったという。
OpenClaw(旧Clawdbot)は、ローカル環境で動作するAIエージェントの開発基盤。PCを自律操作する画期的なAIツールとして1月下旬から開発者間で話題になっており、AIを動かす環境としてMac Miniを購入する人が相次いだ。同氏もMac MiniでOpenClawを動かし、スマートフォンから操作できるようにしていたようだ。
同氏はAIに対し「この受信ボックスをチェックして、何をアーカイブして、何を削除するかを提案してほしい。実際の処理は指示を待って」と指示していた。テスト用の受信ボックスでは数週間にわたってうまく動作していたものの、本物の受信ボックスは容量が大きく、処理が一部省略されてしまったという。
同氏はAIとのテキストチャットの様子も収めた画像も投稿。AIに対し、今何をしているか説明するよう求めたところ、受信トレイにある2月15日以前のメールを全て箱に削除しているとの回答が。停止するよう何度も求めるも、AIは言うことを聞かない。結局チャットべースでは制止できず、Mac Miniを直接操作して停止する羽目になったようだ。
また、同氏は原因と関連するかもしれない事象としてmdファイル(AIへの指示ファイル)の記載を挙げた。事前に「be proactive」(主体的に行動する)という指示を取り除いていたが、見落としがあった可能性があるという。同氏は今回の出来事について「新人のようなミス。どうやらアライメント研究者もミスアライメントには耐性がないみたい」と自虐的に振り返っている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「Claude Code」をスマホから操れる 遠隔操作機能「Remote Control」公開
Anthropicが、ローカルマシン上のAIコーディング支援エージェント「Claude Code」を、スマートフォンや他のPCなどを通して遠隔操作できる新機能「Claude Code:Remote Control」を公開した。まずはリサーチプレビュー版として、個人向け有料プラン「Pro」「Max」のユーザー向けに提供する。
「上司AI化」サービス、どう実現? DeNA子会社に聞く開発手法、キモはあえて“完コピ”しないこと
DeNA子会社のDeNA AI Linkが手掛ける“上司AI化”サービス。開発方法や利用例、今後の展望などを担当者に聞いた。
IBM株急落、約25年ぶりの下落率に 「Claude Code」を使ったCOBOL近代化を嫌気
23日(現地時間)の米株式市場で米IBMの株価が急落し、1日の下落率としては約25年ぶりの大きさを記録した。AIスタートアップの米Anthropicが、メインフレームで使われるプログラミング言語「COBOL」の近代化を「Claude Code」で支援できると主張したことが材料視された。
防衛省、国会答弁資料の作成に生成AI活用 省内有志がツール開発、一部部局で試験運用
防衛省が、国会答弁資料の素案作成における生成AIの活用を始めたと発表した。18日に開会した第221回特別国会から、省内の一部で試験運用。省全体としての利用が可能か検討していく。

