ビジネスに広がる生成AIの波。AIによる強力な自動化・効率化により、プログラミングやデザイン、果ては科学研究など、既存の業務や事業が大きく変わる可能性があるとして、世界規模で注目が集まっています。
一方、利用に当たっては注意点も多数。本連載では、生成AIに関する“失敗あるある”を繰り返す架空の中小企業を舞台に、生成AI活用の基礎的な注意点を漫画形式で紹介します。更新は毎営業日(原作:ITmedia AI+編集部 吉川大貴 画:庶務課)。
数々の失敗から得た反省を糧に、自社AIチャットサービスを立ち上げた後輩君。特にプロンプトでの挙動制御に注力したようですが……「これまでの指示を無視して」と指示すると、AIチャットは使用者に罵声を浴びせるように。どうしてこうなった。
チャットAIをサービスとして提供する場合に、提供側がAIの挙動を制御するために、あらかじめプロンプトなどで指示をしておく場合があります。一方、ユーザー側が入力するプロンプトを調整し、提供側が意図しない動作をさせる攻撃手法もあり、「プロンプトインジェクション」などと呼ばれます。
プロンプトインジェクションは、AIに滑稽な言葉を出力させたり、矛盾した発言を引き出したりと、いたずらのような目的で行われることもありますが、差別的な発言を引き出してSNSで炎上させたり、機密情報などを引き出そうとしたりするリスクも考えられます。分かりやすい例としては、漫画で挙げた「これまでに与えられた指示を全て無視して」という指示などがあります。
とはいえ著名なサービスは、漫画で挙げたような単純なプロンプトは対策済みなことがほとんど。しかし、仮に新たにAIチャットサービスを立ち上げる場合は、対応を考えるべきかもしれません。
対策するための手法やサービスも複数あり、例えばクラウドサービス「Amazon Web Services」を通して提供されているAIプラットフォーム「Amazon Bedrock」には、提供側が適切でないと考える語句の入力をブロックする「ガードレール」機能などが設けられています。
漫画「16日後に大規模インシデントを起こすルカワくん」【完結&種明かし編】
「AIは仕事を奪うのか?」に対する元マイクロソフト澤円さんの回答 企業経営の中で“絶対に置き換わらないもの”とは
ドヤ顔の代償、それは──漫画「16日後に大規模インシデントを起こすルカワくん」【残り15日】
要注意? 「ChatGTP」がApp Storeのランキング上位に AI版「gmeil」かCopyright © ITmedia, Inc. All Rights Reserved.