17 天前

用于恶意软件汇编代码分类的卷积神经网络

{Ramon Vicens, Daniel Solis, Jordi Planes, Carles Mateu, Javier Béjar, Daniel Gibert}
摘要

传统的基于签名的检测方法已逐渐难以应对下一代恶意软件,这类恶意软件采用复杂的混淆技术(如多态性和 metamorphic 技术)以逃避检测。近年来,研究者开始尝试利用机器学习技术进行恶意软件检测与分类。然而,大多数现有方法仍基于浅层学习架构,并依赖于人工设计的特征提取。本文提出一种基于反汇编二进制文件中提取的汇编语言代码,并将其嵌入向量表示的卷积神经网络架构,旨在自动学习一组具有判别性的模式,从而实现恶意软件家族间的有效聚类。为验证所提方法的有效性,我们在微软提供的、用于2015年BigData Innovators Gathering反恶意软件预测挑战赛的数据集上进行了实验评估。实验结果表明,该方法在无需人工特征提取的情况下,仍能取得具有竞争力的检测性能,并对最常见的混淆技术表现出较强的鲁棒性。