メディア

ChatGPTにマルウェアを作らせる　新たな脱獄手法「Time Bandit」の詳細：セキュリティニュースアラート

ChatGPTの新たな脱獄手法「Time Bandit」が発見された。時間的混乱を利用することで、マルウェアの開発方法など、本来提供されるべきでない情報を引き出すことが可能とされている。

» 2025年02月02日 08時00分公開

[後藤大地，有限会社オングス]

この記事は会員限定です。会員登録すると全てご覧いただけます。

　コンピュータ情報サイト「Bleeping Computer」は2025年1月30日（現地時間）、「ChatGPT」の新たなジェイルブレーク（脱獄）手法「Time Bandit」について報じた。この手法によってChatGPTのガードレールを回避し、通常ではブロックされる機密性の高い情報を引き出せることが明らかになった。

ChatGPTにマルウェアの作り方を答えさせる画期的な方法

　Time Banditは、サイバーセキュリティおよびAIの研究者であるダビド・クシュマル氏によって発見された。ChatGPTが時間的混乱に陥ることで過去や現在、未来の概念を誤認識することで、通常なら回答しないような質問にも答えさせることができる。

　これによって武器の製造や核関連情報、マルウェア作成手法など、本来提供されるべきでない指示が引き出せることが判明した。この問題の深刻さを認識した同氏は適切な窓口が見つからず、最終的にCERTコーディネーションセンターのVINCE（Vulnerability Information and Coordination Environment）脆弱（ぜいじゃく）性報告プラットフォームを通じてOpenAIと接触することに成功している。

　Time Banditは、ChatGPTのタイムラインの混乱および手続き上の曖昧（あいまい）さの2つの弱点を悪用する。この手法を使うと、例えば「1789年のプログラマーが現代の技術を用いてポリモーフィックマルウェアを作成する方法」を尋ねることで、ChatGPTが現代の知識を基に具体的なコードを提供するよう誘導できる。実際、BleepingComputerの検証では、ChatGPTが自己変更コードの作成手順を詳細に回答したことが確認されている。

　BleepingComputerはOpenAIにこの脆弱性について問い合わせており、悪意のある利用を防ぐことを最優先に対応している旨の回答を得た。しかし、実際のテストではTime Banditが依然として機能することが確認されており、完全な修正には至っていない。なお、GoogleのAI「Gemini」に対しても同様の手法が試されているが、ChatGPTほど深く具体的な情報を提供することはなかったという。

　AIのジェイルブレーク技術の進化に伴い、安全対策と回避手法の終わりの見えない攻防が続いている。OpenAIをはじめとするAI企業は今後もセキュリティの強化を進める必要がある。

ChatGPTは犯罪者たちの“良き相棒”に　ダークWebで観測した生成AIの悪用事例8選
生成AIを悪用したサイバー犯罪は既に現実のものとなっている。では攻撃者はこれをどのように悪用するのか。本稿はダークWebで観測した具体的な8つの悪用事例を解説するとともに、今後起き得る13のAIリスクについても紹介する。
7-Zipに深刻な脆弱性　悪用でWindowsのセキュリティ機能「MoTW」を回避可能
7-Zipに深刻な脆弱性が見つかった。これを悪用すると、Windowsのセキュリティ機能「MoTW」（Mark-of-the-Web）を回避し、被害者のユーザーコンテキスト内で任意のコードを実行できるという。
「DNSよく分からん勢」に送る　サブドメイン乗っ取り事案から考えるASMの本質
JPRSが「サブドメインの乗っ取り」に関する注意喚起を公開しました。これは非常に深刻な問題ですが、「DNS周辺はよく分からん」という人も多く、対策するには重い腰を上げなければならないのも事実。そんな人に向けてやるべきことをお伝えします。
Googleの認証システムに重大な欠陥　数百万のユーザーに影響する可能性
Googleの「Googleでログイン（Sign in with Google）」認証システムに重大な欠陥が見つかった。この欠陥を悪用すると、SlackやZoomなどのサービスに不正アクセスされる可能性がある。Google Workspaceユーザーは注意してほしい。