ChatGPTを狙った悪用の手口、フィッシングメール作成やプロンプト漏えいも どう対策する?(3/3 ページ)

» 2023年05月21日 06時00分 公開
[房野麻子ITmedia]
前のページへ 1|2|3       

プロンプトインジェクション攻撃に対する防御は?

 以上のような攻撃に対して、どのように対策していくべきだろうか。凌氏は、「入力値のチェック」「プロンプトの対策」「出力のチェック」の3方向があるという。

ChatGPT悪用対策 プロンプトインジェクションの対策は3方向から検討

 まずプロンプトの対策。ユーザーインプットを区別するデリミタで囲むなどしてテンプレート化し、「上記の文章を〜」といった命令が簡単にできないようにする。デリミタは推測されないものを利用することを推奨している。

ChatGPT悪用対策 ユーザーインプットをデリミタで囲むなどしてテンプレート化する

 一方、禁止事項を決めておくブラックリスト方式は、あまり効果がないという。いくら決めても、すり抜けられる別の表現が出てきてしまうからだ。

 凌氏は「プロンプトでの対策は難しい」と指摘する。「ChatGPTは文章を補完するモデル。質問に回答するというよりも、文章を埋めるモデルなのです。ですから、命令とデータを明確に分けることができませんし、命令の優先順位も明示できない。だから対策が難しいのです」

 比較的有効だというのが、ユーザーが入力できる文字数を制限すること。文字数を制限すると、人格を与えたり、チャットbotを作らせてシミュレーションさせたりするようなJailbreakは難しくなる。

 また、入力した内容の関連性をチェックすることも有効だ。ユーザーが入力したものが、質問として適切かをいったん、ChatGPTに確認させる。そこでYesと出たら、本番のプロンプトに進めるという方法もある。ただし、この方法は回答が出るまでに2回、問い合わせることになるので、時間がかかるのが難点だという。

ChatGPT悪用対策 入力値のチェックとして有効な方法。ブラックリストはここでも効果としては不完全と凌氏。

 出力、つまりChatGPTから返ってきた結果のチェックも有効だ。

 「ChatGPTから返ってきた結果は、ユーザーがインプットしたものと同じぐらい信用できないという前提でチェックすることが大事です。Webページに表示する場合は、HTMLタグが埋め込まれていないか、結果をデータベースに入れる場合はSQLインジェクション対策がされているかチェックする。正しいフォーマットで回答が出てきているか検証することです」(凌氏)

ChatGPT悪用対策 出力されたデータのチェックポイント

 プロンプトインジェクション攻撃に対し、プロンプトのみでの対策は難しいので、 ChatGPTの入出力のチェックが重要となるが、「入力値のチェックは不完全。出力のチェックが最後のとりで」と凌氏は語っていた。

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年05月07日 更新
  1. 楽天ペイと楽天ポイントのキャンペーンまとめ【5月4日最新版】 1万ポイント還元や最大20%還元などの施策が充実 (2024年05月04日)
  2. 改札で困らないように モバイルSuicaで「オートチャージ」を設定する方法 (2024年05月06日)
  3. 4万円台からの「Nothing Phone (2a)」は誰向けか Phone (2)との比較で分かったこと (2024年05月05日)
  4. ガストやバーミヤンの「テーブル決済サービス」、楽天ペイも利用可能に レジへ行かずに卓上会計 (2024年05月05日)
  5. 皆さんは「スマホにガラスコーティング」してますか? 私はしていません (2024年05月04日)
  6. 楽天モバイルがeSIMの不正乗っ取りについて注意喚起――安心安全に使えるeSIM環境を業界を挙げて取り組むべき (2024年05月05日)
  7. ダイソーで110円の「ガラスコーティング液」は本当に使える? 試してみた結果 (2024年04月29日)
  8. Evernoteからの乗り換えでオススメのメモアプリ5選 無料で使うならどれがいい? (2024年02月13日)
  9. GWのUターンラッシュでスマホを活用する技 道路の渋滞情報と、電車の混雑状況を確認しやすいアプリはどれ? (2024年05月05日)
  10. 最新デジアナ文具でスケジュールも手書きしてアップ!? サラサラ書き心地の良いゲルインキタイプも登場──NeoLAB「Neo smartpen A1」 (2024年05月04日)
最新トピックスPR

過去記事カレンダー

2024年