HyperAIHyperAI
منذ 2 أشهر

شرح واستخدام الأمثلة المعادية

Ian J. Goodfellow; Jonathon Shlens; Christian Szegedy
شرح واستخدام الأمثلة المعادية
الملخص

تتعرض العديد من نماذج التعلم الآلي، بما في ذلك الشبكات العصبية، باستمرار لتصنيف الأمثلة المعادية بشكل خاطئ --- وهي مدخلات تشكل عن طريق تطبيق تغييرات صغيرة ولكن متعمدة ومثلى للأسوأ على أمثلة من مجموعة البيانات، بحيث يؤدي المدخل المتغير إلى إخراج النموذج لإجابة خاطئة بثقة عالية. ركزت المحاولات الأولى لتفسير هذه الظاهرة على اللاخطية والتكيف الزائد. ومع ذلك، نحن ندعي أن السبب الرئيسي لضعف الشبكات العصبية أمام التغييرات المعادية هو طبيعتها الخطية. يدعم هذا التفسير نتائج كمية جديدة بينما يقدم أول تفسير لأكثر الحقائق إثارة للدهشة حولها: انتشارها عبر الأطر والمجموعات التدريبية. بالإضافة إلى ذلك، فإن هذا المنظور يوفر طريقة بسيطة وسريعة لإنشاء الأمثلة المعادية. باستخدام هذا الأسلوب لتوفير أمثلة للتدريب المعادي، نقلل من خطأ مجموعة الاختبار لنظام maxout على مجموعة بيانات MNIST (Maxout Network).