مصنف متعامد لتحسين مقاومة الشبكات العصبية للهجمات العدائية

الشبكات العصبية عرضة للتشويشات العدائية المُصممة صناعيًا. أظهرت الجهود الحديثة أن إدخال تعديلات معينة على طبقة التصنيف يمكن أن يعزز من مقاومة الشبكات العصبية. في هذا البحث، نقوم ببناء صريح لمصفوفة وزن متعامدة كثيفة (Dense Orthogonal Weight Matrix) بحيث تكون قيم عناصرها متساوية في المقدار، مما يؤدي إلى تصنيف جديد يتمتع بمقاومة عالية. يتجنب هذا المصنّف المشكلة الهيكلية غير المرغوب فيها التي كانت موجودة في الدراسات السابقة. ويُكفي تطبيق هذا المصنّف في التدريب القياسي على بيانات نظيفة لضمان دقة عالية ومقاومة جيدة للنموذج. علاوة على ذلك، عند استخدام عينات عدائية إضافية، يمكن تحقيق مقاومة أفضل بمساعدة دالة خسارة خاصة تُعرف بدالة الخسارة في أسوأ الحالات (Worst-case Loss). تُظهر النتائج التجريبية أن طريقة我们的 فعّالة وتنافسية مقارنة بعدة أساليب دفاعية حديثة جدًا. يُمكن الوصول إلى الكود الخاص بنا من خلال الرابط التالي: \url{https://github.com/MTandHJ/roboc}.