الشبكة العصبية التلافيفية لتصنيف كود التجميع الضار
بدأت الطرق التقليدية القائمة على التوقيع أن تصبح غير كافية في التعامل مع البرمجيات الخبيثة من الجيل التالي، والتي تستخدم تقنيات معقدة للإخفاء (التحول البوليمرية والمتغيرة الشكل) للتهرب من الكشف. في الآونة الأخيرة، تم إجراء جهود بحثية على كشف البرمجيات الخبيثة وتصنيفها من خلال تطبيق تقنيات التعلم الآلي. وعلى الرغم من ذلك، تظل معظم هذه الطرق مبنية على هياكل تعلم سطحية وتستند إلى استخلاص ميزات مصممة يدويًا. في هذا البحث، نقدم بنية شبكة عصبية تلافيفية (Convolutional Neural Network) تعتمد على كود بلغة التجميع المستخرج من ملفات ثنائية تم فك تجميعها، وتم تضمينه في متجهات، بهدف تعلّم مجموعة من الأنماط التمييزية القادرة على تجميع ملفات البرمجيات الخبيثة ضمن عائلاتها. ولإثبات ملاءمة نهجنا، قمنا بتقييم نموذجنا على البيانات المقدمة من مايكروسوفت في مسابقة التنبؤ بالبرمجيات الخبيثة ضمن فعالية BigData Innovators Gathering 2015. تُظهر التجارب أن الطريقة تحقق نتائج تنافسية دون الاعتماد على استخلاص يدوي للميزات، وهي أيضًا مقاومة لأكثر تقنيات الإخفاء شيوعًا.