ニュース
AIの安全性を“攻撃者視点”で評価するガイドライン IPAなどが無料公開 LLMへの8つの攻撃手法を紹介
情報処理推進機構(IPA)が国などと協力して設立した「AIセーフティ・インスティテュート」 (AISI)は、AIシステムの安全性を評価するガイドライン「AIセーフティに関するレッドチーミング手法ガイド」を公開した。
情報処理推進機構(IPA)が国などと協力して設立した「AIセーフティ・インスティテュート」(AISI)は9月25日、AIシステムの安全性を評価するガイドライン「AIセーフティに関するレッドチーミング手法ガイド」を公開した。システムのリスク対策を攻撃者の視点から評価する「レッドチーミング手法」の基本について解説したという。
ガイドラインの対象となるのは、大規模言語モデル(LLM)を構成要素とするAIシステム(LLMシステム)。攻撃者が悪意あるプロンプトをAIシステムに直接注入する「直接プロンプトインジェクション」など、LLMシステムへの代表的な8つの攻撃手法を例示し、レッドチーミングを実施する際の体制や工程などについても説明した。
このガイドラインは、2024年4月に国が公表した「AI事業者ガイドライン」と国内外の文献、関連事業者などへの調査を踏まえて作成。ガイドライン本体と概要説明資料はAISIのWebサイトからダウンロードできる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AIの安全性評価ガイドライン公開 IPAと国などが設立したAISIから
AI開発者・提供者向けに、AIの安全性などを評価する「AIセーフティ評価」の観点や手法をまとめたガイドブックをAISIが公開した。
「我が社がサイバー攻撃の被害に!」なときに使えるコミュニケーションのコツ集 IPAが公開
IPAが、サイバーインシデントの対応時に求められる社内コミュニケーションのノウハウをまとめた資料「サイバーレジリエンスのためのコミュニケーション 〜セキュリティ担当者に必要なコミュニケーションスキル集〜」を公開した。
サポート詐欺の実態まとめたレポート、IPAが公開 ニセ警告画面を閉じるショートカットが効かなくなっていく傾向に
情報処理推進機構が、独自の調査や寄せられた相談などを基に、サポート詐欺の手口や傾向、その変化をまとめたレポートを公開した。「情報セキュリティ関連の業務に従事している方へ、手口や被害状況の実態を共有することで、被害低減や対策推進に資することが目的」という。
IPA、「情報セキュリティ白書2024」発行 PDF版はアンケート回答で無料ダウンロード可
情報処理推進機構(IPA)は30日、「情報セキュリティ白書」を発行した。PDF版はアンケートに答えれば無料でダウンロードできる。
「AI事業者ガイドライン案」のパブコメ、20日から募集開始 生成AIの社会的リスクとどう向き合う?
経済産業省と総務省は、生成AIの普及を踏まえてとりまとめた「AI事業者ガイドライン案」のパブリックコメントの募集を始めると発表した。

