HyperAIHyperAI
منذ 11 أيام

تجميع كل شيء في كل مكان: تجميع متعدد المقاييس لمقاومة الهجمات الخبيثة

Stanislav Fort, Balaji Lakshminarayanan
تجميع كل شيء في كل مكان: تجميع متعدد المقاييس لمقاومة الهجمات الخبيثة
الملخص

تُشكّل الأمثلة المضادة تحديًا كبيرًا لمقاومة الشبكات العصبية العميقة، وموثوقيتها، وتماسكها. نُقدّم منهجًا جديدًا سهل الاستخدام لتحقيق تمثيلات عالية الجودة تؤدي إلى مقاومة مُضادة من خلال استخدام تمثيلات متعددة الدقة للمدخلات وتمثيل ذاتي ديناميكي للتنبؤات في الطبقات الوسطى. نُظهر أن التنبؤات في الطبقات الوسطى تمتلك مقاومة طبيعية لهجمات المُضاد التي تهدف إلى خداع الفئة الكاملة، ونُقترح آلية تجميع مقاومة قائمة على مزاد فيكوري نسمّيه \textit{CrossMax} لتجميعها ديناميكيًا. وبدمج المدخلات متعددة الدقة مع آلية التجميع المقاومة، نحقق مقاومة مُضادة كبيرة على مجموعتي بيانات CIFAR-10 وCIFAR-100 دون الحاجة إلى تدريب مُضاد أو بيانات إضافية، ونصل إلى دقة مُضادة تبلغ حوالي 72% (CIFAR-10) وحوالي 48% (CIFAR-100) في مجموعة اختبار RobustBench AutoAttack ($L_\infty=8/255$) باستخدام نموذج ResNet152 مُعدّل مسبقًا على ImageNet. ويمثل هذا الأداء نتيجة مُقارنة بالنموذج الأول في CIFAR-10، ويفوق الأفضل الحالي على CIFAR-100 بنسبة +5%. وبالإضافة إلى تدريب مُضاد بسيط، نصل إلى حوالي 78% على CIFAR-10 وحوالي 51% على CIFAR-100، مما يُحسّن الأداء القياسي (SOTA) بنسبة 5% و9% على التوالي، مع تحقيق مكاسب أكبر على المجموعة الأصعب. ونُثبت صحة منهجنا من خلال تجارب مكثفة، ونقدّم رؤى حول التفاعل بين المقاومة المُضادة والطبيعة الهرمية للتمثيلات العميقة. ونُظهر أن الهجمات القائمة على التدرج البسيطة ضد نموذجنا تُنتج صورًا قابلة للفهم البشري للطبقات المستهدفة، وكذلك تغييرات قابلة للتفسير في الصور. كمنتج ثانوي، وباستخدام أولوية الدقة المتعددة لدينا، نحول النماذج المُدرّبة مسبقًا والأنظمة CLIP إلى مُولّدات صور قابلة للتحكم، ونُطوّر هجمات قابلة للانتقال على نماذج الرؤية واللغة الكبيرة.