小林啓倫のエマージング・テクノロジー論考
生成AIのセキュリティ演習は“それっぽく見えるだけ”? 「AIレッドチーミング」を考える(2/4 ページ)
米Googleも23年7月に発表したレポートの中で、社内に設置されたAI専門レッドチームの活動を報告している。Googleは具体的にいつAIレッドチーミングを開始したかは明記していないが、社内レッドチームの立ち上げは、「10年以上前」にさかのぼるそうだ。
またChatGPTでおなじみの米OpenAIは23年9月、社外の専門家で構成される「OpenAI Red Teaming Network」の立ち上げを発表している。これはGoogleとは異なり、専門家と契約を結び、彼らに対して実施した業務単位で報酬を支払うという形式を取っている。実際にこのネットワークを通じて、OpenAIのLLMであるGPTシリーズや、動画生成AI「Sora」のテストが行われたことも明らかになっている。
こうしたIT企業におけるAIレッドチーミングの取り組みの追い風となっているのが、23年10月に発表された、バイデン大統領による「AIの安全、安心、信頼できる開発と使用に関する大統領令」だ。
この大統領令では、基盤モデルを開発する企業に対し各種情報を提供するよう求めており、その中にレッドチーミングの実施結果も含まれている。またNIST(米国国立標準技術研究所)に対して、AIレッドチーミングのガイドラインを作成するよう求めている。いわば米連邦政府という重要な存在が、AIレッドチーミングにお墨付きを与えた格好だ。
生成AIレッドチーミングは“演劇”なのか?
このように盛り上がりを見せるレッドチーミングだが、一方で生成AIを相手にした場合、果たしてこの手法がどこまで有効なのか? という疑問の声も挙がっている。
例えば1月、米カーネギーメロン大学の研究者らが「生成AIに対するレッドチーミングは『セキュリティシアター』で終わる危険性がある」とする論文を発表している。セキュリティシアターとは、セキュリティ対策を実施したように見えるものの、実際にはセキュリティの向上に何ら効果の無い取り組みのことを指す。シアター(劇場)で行われる演劇のように、それっぽく見えるが真実ではない、という意味が込められている。
研究者らはこの論文の中で、生成AIに対するレッドチーミングが一定の効果を上げることを認めつつ、「レッドチーミングがあらゆる潜在的なリスクに対する万能薬であるかのような言及は、セキュリティシアターの域を出ない」として、その課題や限界にも目を向けるべきだと主張している。
それでは具体的に、どのような懸念点が示されているのか。主なものをまとめてみよう。
Copyright © ITmedia, Inc. All Rights Reserved.
小林啓倫のエマージング・テクノロジー論考
生成AIやメタバース、新たなサイバー攻撃など、テクノロジーの進化が止まらない。少しずつ生活の中に浸透し、その恩恵を預かれることもある一方、思いもよらない問題を生み出すこともある。このコーナーでは、さまざまな分野の新興技術「エマージング・テクノロジー」について、小林啓倫氏が解説する。
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
6
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
-
7
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
8
光接続の標準規格「OCI」対応シリコン、GFが27年に投入
-
9
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
10
「ねこ」検索で「手押し一輪車」表示――モノタロウが守った、生成AIに“譲れない”購買体験
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR