ニュース
ソフォスらが2000万件のデータセットを公開、マルウェア検出の機械学習モデル開発目指す
Sophos AIとReversingLabsがマルウェア検出の機械学習モデル発見につながる2000万のデータセットを公開した。マルウェアに関する、整備済みの大規模なデータセットが広く公開されたことで業界全体でマルウェア検出機能強化につながる可能性がある。
Sophosは2020年12月14日(現地時間)、Sophos AIとReversingLabsが協力して開発したデータセット「SOREL-20M」を公開したと伝えた。セキュリティ研究に使用できる標準となるデータを提供することで、セキュリティ機能の強化につながる機械学習モデルの研究開発を促進する狙いがあるとしている。
未知のマルウェアなどの悪意あるソフトウェアを検出する方法として、機械学習が注目を集める。しかし機械学習に使用する標準的なデータセットが存在していないため、組織や研究者は、個別にデータセットを用意して研究開発を進めているのが現状だ。
マルウェア検出モデル開発の標準データセットと公開データのありか
Copyright © ITmedia, Inc. All Rights Reserved.