ソフォスらが2000万件のデータセットを公開、マルウェア検出の機械学習モデル開発目指す

Sophos AIとReversingLabsがマルウェア検出の機械学習モデル発見につながる2000万のデータセットを公開した。マルウェアに関する、整備済みの大規模なデータセットが広く公開されたことで業界全体でマルウェア検出機能強化につながる可能性がある。

» 2020年12月17日 11時30分 公開
[後藤大地有限会社オングス]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 Sophosは2020年12月14日(現地時間)、Sophos AIとReversingLabsが協力して開発したデータセット「SOREL-20M」を公開したと伝えた。セキュリティ研究に使用できる標準となるデータを提供することで、セキュリティ機能の強化につながる機械学習モデルの研究開発を促進する狙いがあるとしている。

Sophos-ReversingLabs(SOREL) 20 Million sample malware dataset|Sophos AI Sophos-ReversingLabs(SOREL) 20 Million sample malware dataset|Sophos AI

 未知のマルウェアなどの悪意あるソフトウェアを検出する方法として、機械学習が注目を集める。しかし機械学習に使用する標準的なデータセットが存在していないため、組織や研究者は、個別にデータセットを用意して研究開発を進めているのが現状だ。

マルウェア検出モデル開発の標準データセットと公開データのありか

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ