التدريب المعادي مجانًا!

التدريب المعادي، حيث يتم تدريب الشبكة على أمثلة معادية، هو أحد القلائل من الأساليب الدفاعية التي تقاوم الهجمات المعادية القوية. للأسف، فإن التكلفة العالية لإنشاء أمثلة معادية قوية تجعل التدريب المعادي القياسي غير عملي في مشاكل كبيرة مثل ImageNet. نقدم خوارزمية تقضي على التكلفة الإضافية لإنشاء الأمثلة المعادية عن طريق إعادة استخدام المعلومات المتدرجة المحسوبة عند تحديث معلمات النموذج. يحقق خوارزمية التدريب المعادي "المجان" لدينا مقاومة مماثلة لتدريب PGD المعادي على مجموعات البيانات CIFAR-10 وCIFAR-100 بتكلفة إضافية قليلة مقارنة بالتدريب الطبيعي، ويمكن أن تكون أسرع 7 إلى 30 مرة من طرق التدريب المعادي الأخرى القوية. باستخدام محطة عمل واحدة تحتوي على 4 بطاقات رسوميات P100 و2 يوم من وقت التشغيل، يمكننا تدريب نموذج مقاوم للمهمة الكبيرة لتصنيف ImageNet يحافظ على دقة بنسبة 40% ضد هجمات PGD. الرمز متاح في https://github.com/ashafahi/free_adv_train.