StyleAdv: تدريب معاكس نمطي من نوع ميتا للتعلم القليل النموذج عبر المجالات

يُعد التعلم القليل عبر المجالات (CD-FSL) مهمة ظهرت حديثًا تتناول التعلم القليل عبر مجالات مختلفة. ويهدف هذا المفهوم إلى نقل المعرفة السابقة المكتسبة من مجموعة بيانات مصدرية إلى مجموعات بيانات مستهدفة جديدة. وتُعد المهمة مُحَدَّدة بشكل خاص بوجود فجوة كبيرة بين المجالات المختلفة لمجموعات البيانات. وتشير الدراسات التجريبية إلى أن هذه الفجوة تنشأ في الواقع من تغيرات في الأنماط البصرية، وأن نموذج wave-SAN يُظهر تجريبيًا أن توسيع توزيع الأنماط في البيانات المصدرية يساعد في تخفيف هذه المشكلة. ومع ذلك، فإن wave-SAN يُجري عملية بسيطة فقط، وهي استبدال أنماط صورتين، مما يؤدي إلى توليد أنماط "واقعية" و"سهلة"، والتي لا تزال ضمن المجموعة الأصلية لأنماط البيانات المصدرية. لذلك، مستوحى من التعلم العدواني التقليدي، نقترح طريقة جديدة تُسمى التدريب العدواني للأنماط المستقل عن النموذج (StyleAdv)، بالإضافة إلى طريقة جديدة لاختراق أنماط عدوانية. وتحديدًا، تُولّد طريقة اختراق الأنماط لدينا أنماطًا عدوانية "افتراضية" و"صعبة" لتدريب النموذج، وذلك من خلال إدخال اهتزازات على النمط الأصلي باستخدام متجهات التدرج الموقعة للنمط. وباستمرار مهاجمة الأنماط وفرض على النموذج التعرف على هذه الأنماط العدوانية الصعبة، يصبح النموذج تدريجيًا أكثر مقاومةً للتغيرات في الأنماط البصرية، مما يعزز قدرته على التعميم على مجموعات بيانات جديدة. علاوةً على ذلك، استخدمنا طريقة StyleAdv مع هيكل رئيسي مبني على الشبكات العصبية التلافيفية (CNN) الشائعة، كما طبّقناها أيضًا على نموذج محول البصريات المُدرّب مسبقًا على نطاق واسع (Vision Transformer). وقد أظهرت التجارب الواسعة التي أُجريت على ثمانية مجموعات بيانات مستهدفة مختلفة فعالية طريقتنا. سواء تم بناء النموذج على أساس ResNet أو ViT، فقد حققنا أحدث النتائج المُحققة في مجال CD-FSL. يمكن الوصول إلى الكود عبر الرابط: https://github.com/lovelyqian/StyleAdv-CDFSL.