HyperAIHyperAI
منذ 2 أشهر

SAD: دفاعات مستندة إلى البارزة ضد الأمثلة المعادية

Richard Tran; David Patrick; Michael Geyer; Amanda Fernandez
SAD: دفاعات مستندة إلى البارزة ضد الأمثلة المعادية
الملخص

مع زيادة شعبية نماذج التعلم الآلي والتعلم العميق، ازداد التركيز على عرضها للهجمات الخبيثة. هذه الأمثلة المعادية تحرف توقعات النموذج بعيدًا عن الهدف الأصلي للشبكة وهي مصدر قلق متزايد في الأمن العملي. لمحاربة هذه الهجمات، يمكن للشبكات العصبية الاستفادة من الأساليب التقليدية لمعالجة الصور أو من النماذج الدفاعية المتقدمة لتقليل التشويش في البيانات. الأساليب الدفاعية التي تتبنى نهجًا شاملًا لتقليل الضوضاء تكون فعالة ضد الهجمات المعادية، ومع ذلك فإن نهجها الذي يفقد بعض المعلومات غالبًا ما يشوه بيانات مهمة داخل الصورة. في هذا البحث، نقترح نهجًا يستند إلى البارزة البصرية لتنظيف البيانات المتأثرة بهجوم معادي. يستخدم نموذجنا المناطق البارزة في الصورة المعادية لتوفير إجراء مضاد موجه بينما يقلل بشكل مقارن من فقدان المعلومات داخل الصور المنظفة. نقيس دقة نموذجنا بتقييم فعالية أفضل الأساليب البارزة قبل الهجوم، أثناء الهجوم، وبعد تطبيق طرق التنظيف. نوضح فعالية النهج المقترح بالمقارنة مع الدروع ذات الصلة وبالضد من أساليب الهجمات المعادية المعروفة، عبر مجموعتين من بيانات البارزة. يظهر نهجنا المستهدف تحسينات كبيرة في مجموعة واسعة من مقاييس البارزة الإحصائية والمسافة القياسية، بالمقارنة مع الأساليب التقليدية والأحدث على حد سواء.

SAD: دفاعات مستندة إلى البارزة ضد الأمثلة المعادية | أحدث الأوراق البحثية | HyperAI