AIの安全性を“攻撃者視点”で評価するガイドライン IPAなどが無料公開 LLMへの8つの攻撃手法を紹介
情報処理推進機構(IPA)が国などと協力して設立した「AIセーフティ・インスティテュート」(AISI)は9月25日、AIシステムの安全性を評価するガイドライン「AIセーフティに関するレッドチーミング手法ガイド」を公開した。システムのリスク対策を攻撃者の視点から評価する「レッドチーミング手法」の基本について解説したという。
ガイドラインの対象となるのは、大規模言語モデル(LLM)を構成要素とするAIシステム(LLMシステム)。攻撃者が悪意あるプロンプトをAIシステムに直接注入する「直接プロンプトインジェクション」など、LLMシステムへの代表的な8つの攻撃手法を例示し、レッドチーミングを実施する際の体制や工程などについても説明した。
このガイドラインは、2024年4月に国が公表した「AI事業者ガイドライン」と国内外の文献、関連事業者などへの調査を踏まえて作成。ガイドライン本体と概要説明資料はAISIのWebサイトからダウンロードできる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
-
2
公式がワンコーラス公開→AIで無断フルコーラス化、拡散 大原ゆい子氏「無職転生III」OPが被害
-
3
ChatGPTで広告表示へ 無料・Goプランが対象 6月22日にポリシー更新
-
4
「日本がいないと成り立たない」世界へ、フィジカルAIが導く独自の交渉力
-
5
「もはや宗教」のClaudeに焦るOpenAI 流出メモが暴いた覇権交代のリアル
-
6
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
7
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
8
「Siri AI」の進化に「Geminiそのまま」の誤解――現地取材で見えた“新生Apple Intelligence”の全貌
-
9
サッカーW杯、偽ライブ配信サイトに注意 生成AIで詐欺が巧妙化 Acronisが警告
-
10
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR