HyperAIHyperAI
منذ 11 أيام

تحسين التمثيل المتين في التدريب العدواني: معايير التوافق والاستبعاد

Nuoyan Zhou, Nannan Wang, Decheng Liu, Dawei Zhou, Xinbo Gao
تحسين التمثيل المتين في التدريب العدواني: معايير التوافق والاستبعاد
الملخص

الشبكات العصبية العميقة عرضة للضوضاء المضادة. وقد أُثبت أن التدريب المضاد (Adversarial Training - AT) هو الاستراتيجية الدفاعية الأكثر فعالية لحماية الشبكات العصبية من التلاعب. ومع ذلك، نلاحظ أن AT يتجاهل تعلُّم الميزات الصلبة، مما يؤدي إلى أداء ضعيف في المقاومة المضادة. لمعالجة هذه المشكلة، نسلط الضوء على معيارين لتمثيل قوي: (1) الاستبعاد: تبقى الميزة الخاصة بالعينات بعيدة عن ميزات الفئات الأخرى؛ (2) التوافقيّة: تبقى الميزة الخاصة بالعينات الطبيعية والعينات المضادة المقابلة لها قريبة من بعضها البعض. وتُحفّز هذان المعياران اقتراح إطار عام للتدريب المضاد بهدف تحقيق تمثيل قوي، من خلال التباين السلبي غير المتماثل والانتباه العكسي. وبشكل محدد، نصمم تباينًا سلبيًا غير متماثل يستند إلى الاحتمالات المُتنبَّأ بها، لدفع العينات المختلفة الفئات بعيدًا عن بعضها في فضاء الميزات. علاوةً على ذلك، نقترح وزن الميزات باستخدام معاملات المصنف الخطي كـ "انتباه عكسي"، للحصول على ميزات واعية بالفئة وجعل ميزات العينات ذات الفئة الواحدة أقرب إلى بعضها. أظهرت التقييمات التجريبية على ثلاث مجموعات بيانات معيارية أن طريقة التدريب المقترحة تُحسّن بشكل كبير مقاومة التدريب المضاد، وتُحقق أداءً من الطراز الرائد (state-of-the-art).

تحسين التمثيل المتين في التدريب العدواني: معايير التوافق والاستبعاد | أحدث الأوراق البحثية | HyperAI