ITmedia NEWS > 科学・テクノロジー >
セキュリティ・ホットトピックス

ChatGPTでフィッシングサイトを自動検出する方法 NTTセキュリティが開発 精度は98%以上Innovative Tech

» 2023年06月19日 08時00分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2

 NTTセキュリティ・ジャパンに所属する研究者らが発表した論文「Detecting Phishing Sites Using ChatGPT」は、ChatGPTでフィッシングサイトを検出する手法を提案した研究報告である。

 この手法では、Webサイトから情報を収集するためにWebクローラーを使用し、その収集したデータを元にプロンプトを作成する。プロンプトはChatGPTに提示され、ChatGPTは与えられたWebサイトがフィッシングサイトかどうかを判断する。

 WebクローリングとChatGPTの組み合わせにより、Webサイトの正当性や怪しさに関する情報に基づいた判断が可能になり、機械学習モデルを微調整することなく、さまざまなフィッシングサイトを検出できる。また、Webサイト全体やURLのコンテキストから、ソーシャルエンジニアリング(人為的なミスを利用して個人情報などを入手するサイバー攻撃)の特定も可能である。

提案手法の概要図

 フィッシングサイトを検出するためのテキストプロンプトは、次の図のような内容となる。

テキストプロンプトのテンプレート例

 ChatGPTがフィッシングサイトを正しく検知した場合の例と、検知した際のChatGPTの回答例を以下の図に示す。この例では、WebサイトがFacebookになりすましてユーザーを危険にさらそうとしていることや、そのサイトがFacebookと関連していることをChatGPTが正しく認識し、ドメイン名が正規のFacebookでないと判断した。

 さらに、ChatGPTはソーシャルエンジニアリングの存在も認識し、HTML内に疑わしいリンクが存在することを明らかにした。

Facebookを装ったフィッシングサイトの例
Facebookを装ったフィッシングサイトを検知した際の回答例

 提案手法の性能評価のために、フィッシングサイトの検出に特化したデータセットを使用して実験を行った。GPT-4を用いた実験では、98.3%の精度と98.4%の再現率という有望な性能を示した。

 さらに、GPT-3.5とGPT-4の比較分析により、GPT-4の能力が大きく向上していることが明らかになった。GPT-4は、ドメイン名の怪しさの判定、Webサイトの内容からのソーシャルエンジニアリングの特定、複数の要素を考慮した包括的なフィッシング検知においてGPT-3.5を上回った。

 これらの知見は、自動化されたサイバーセキュリティ対策を強化し、ユーザーが直面するオンライン詐欺行為のリスクを軽減するために重要な意味を持つものである。

Source and Image Credits: Takashi Koide, Naoki Fukushi, Hiroki Nakano, and Daiki Chiba. Detecting Phishing Sites Using ChatGPT.



Copyright © ITmedia, Inc. All Rights Reserved.