HyperAIHyperAI
منذ 15 أيام

تنقية مضادة موجهة باللغة

Himanshu Singh, A V Subramanyam
تنقية مضادة موجهة باللغة
الملخص

تُظهر طرق التنقية المضادة باستخدام النماذج التوليدية أداءً قويًا في الدفاع ضد الهجمات المضادة. وتتميز هذه الطرق بأنها غير معتمدة على تصنيف النموذج أو على متجهات الهجوم، مما يجعلها مرنة، لكنها غالبًا ما تكون مكلفة من حيث الحوسبة. وقد ساهمت التطورات الحديثة في شبكات التشتت (diffusion) وشبكات القياس (score networks) في تحسين توليد الصور، وبالتالي تحسين عملية التنقية المضادة. أما الفئة الأخرى من طرق الدفاع المضادة ذات الكفاءة العالية، المعروفة باسم التدريب المضاد (adversarial training)، فهي تتطلب معرفة مسبقة بمتجهات الهجوم، ما يفرض تدريبها بشكل مكثف على أمثلة مضادة. ولتجاوز هذه القيود، نقدّم إطارًا جديدًا يُسمى التنقية المضادة الموجهة باللغة (Language Guided Adversarial Purification - LGAP)، والذي يستخدم نماذج توليد تشتت مُدرّبة مسبقًا ومُولّدات وصف صور (caption generators) للدفاع ضد الهجمات المضادة. عند إدخال صورة، تقوم طريقة LGAP أولاً بإنشاء وصف نصي (caption) لها، ثم تستخدم هذا الوصف لتوجيه عملية التنقية المضادة عبر شبكة تشتت. وقد تم اختبار أسلوبنا ضد هجمات مضادة قوية، ما أثبت فعاليته في تعزيز المقاومة المضادة. وتشير نتائجنا إلى أن LGAP يتفوّق على معظم تقنيات الدفاع المضاد الحالية دون الحاجة إلى تدريب شبكات مخصصة. وهذا يُبرز قدرة النماذج المدرّبة على مجموعات بيانات كبيرة على التعميم، ويُشير إلى اتجاه واعد للبحث المستقبلي.

تنقية مضادة موجهة باللغة | أحدث الأوراق البحثية | HyperAI