情報処理推進機構(IPA)が国などと協力して設立した「AIセーフティ・インスティテュート」(AISI)は9月25日、AIシステムの安全性を評価するガイドライン「AIセーフティに関するレッドチーミング手法ガイド」を公開した。システムのリスク対策を攻撃者の視点から評価する「レッドチーミング手法」の基本について解説したという。
ガイドラインの対象となるのは、大規模言語モデル(LLM)を構成要素とするAIシステム(LLMシステム)。攻撃者が悪意あるプロンプトをAIシステムに直接注入する「直接プロンプトインジェクション」など、LLMシステムへの代表的な8つの攻撃手法を例示し、レッドチーミングを実施する際の体制や工程などについても説明した。
このガイドラインは、2024年4月に国が公表した「AI事業者ガイドライン」と国内外の文献、関連事業者などへの調査を踏まえて作成。ガイドライン本体と概要説明資料はAISIのWebサイトからダウンロードできる。
AIの安全性評価ガイドライン公開 IPAと国などが設立したAISIから
「我が社がサイバー攻撃の被害に!」なときに使えるコミュニケーションのコツ集 IPAが公開
サポート詐欺の実態まとめたレポート、IPAが公開 ニセ警告画面を閉じるショートカットが効かなくなっていく傾向に
IPA、「情報セキュリティ白書2024」発行 PDF版はアンケート回答で無料ダウンロード可
「AI事業者ガイドライン案」のパブコメ、20日から募集開始 生成AIの社会的リスクとどう向き合う?Copyright © ITmedia, Inc. All Rights Reserved.