HyperAIHyperAI
منذ 4 أشهر

تعلم الاضطرابات المعادية الشاملة باستخدام النماذج التوليدية

Jamie Hayes; George Danezis
تعلم الاضطرابات المعادية الشاملة باستخدام النماذج التوليدية
الملخص

يُعرف أن الشبكات العصبية معرّضة للنماذج المعادية، وهي المدخلات التي تم تغييرها عمدًا لكي تظل مشابهة بصريًا للمدخل الأصلي ولكنها تسبب تصنيفًا خاطئًا. وقد أظهرت الدراسات الحديثة أنه مع وجود مجموعة بيانات وصنّف (Classifier)، هناك ما يُسمى بالاضطرابات المعادية العالمية، وهو اضطراب واحد يمكن أن يسبب تصنيفًا خاطئًا عند تطبيقه على أي مدخل. في هذا البحث، نقدم شبكات الاضطرابات المعادية العالمية، وهي شبكة إنشائية قادرة على خداع الصنّف المستهدف عندما يتم إضافة الإخراج الذي تولده إلى عينة نظيفة من مجموعة البيانات. نوضح أن هذه التقنية تحسّن على الهجمات المعادية العالمية المعروفة.