マイページ

注目記事を集めた総合ページ

ITの今と未来を見通す

スマホと通信の最新トレンド

進化するPCとデバイスの未来

好きが集まる　比べて選べる

ビジネスと働き方のヒント

AI活用のいまが分かる

企業ITのトレンドを詳説

経営リーダーのコミュニティ

マーケ×ITの今がよく分かる

ITエンジニア向け専門サイト

企業向けIT製品の総合サイト

IT製品の技術・比較・事例

製造業のIT導入・活用を支援

モノづくり技術者専門サイト

エレクトロニクス専門サイト

電子設計の基本と応用

エネルギーの専門メディア

建設×テクノロジーの最前線

ちょっと気になるネットの話題

ITmedia AI＋
生成AI
AIの安全性を“攻撃者視点”で評価するガイドライン　IPAなどが無料公開　LLMへの8つの攻撃手法を紹介

AIの安全性を“攻撃者視点”で評価するガイドライン　IPAなどが無料公開　LLMへの8つの攻撃手法を紹介

公開 2024年09月26日 12時57分

[ITmedia]

印刷する

　情報処理推進機構（IPA）が国などと協力して設立した「AIセーフティ・インスティテュート」（AISI）は9月25日、AIシステムの安全性を評価するガイドライン「AIセーフティに関するレッドチーミング手法ガイド」を公開した。システムのリスク対策を攻撃者の視点から評価する「レッドチーミング手法」の基本について解説したという。

「AIセーフティに関するレッドチーミング手法ガイド」を公開

　ガイドラインの対象となるのは、大規模言語モデル（LLM）を構成要素とするAIシステム（LLMシステム）。攻撃者が悪意あるプロンプトをAIシステムに直接注入する「直接プロンプトインジェクション」など、LLMシステムへの代表的な8つの攻撃手法を例示し、レッドチーミングを実施する際の体制や工程などについても説明した。

LLMシステムへの代表的な8つの攻撃手法を紹介（概要説明資料より引用）

　このガイドラインは、2024年4月に国が公表した「AI事業者ガイドライン」と国内外の文献、関連事業者などへの調査を踏まえて作成。ガイドライン本体と概要説明資料はAISIのWebサイトからダウンロードできる。

Copyright © ITmedia, Inc. All Rights Reserved.

印刷する

関連記事

SpecialPR

メールマガジンを配信中

メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

メールマガジン最新号

Anthropic、最上位「ミュトス」級モデルを一般提供　悪用防ぐ保護機能を備えた「Claude Fable 5」 SBIグループ、米Anthropicと提携　Claudeを全役職員に展開　セキュリティツール「Claude Security」共同検証も

SpecialPR

よく見られているカテゴリー

アクセスランキング

もっと見る

SpecialPR

ITmedia AI＋ SNS

@itm_aiplusをフォロー

インフォメーション

注目情報をチェック

お問い合わせ

広告に関するお問い合わせ

ITmedia AI＋をフォロー

あなたにおすすめの記事PR