EUDA: تكييف مجال غير مراقب فعّال من خلال محول رؤية ذاتي التدريب

يهدف التكيّف غير المُراقب للنطاق (UDA) إلى تقليل مشكلة الانزياح النطاقي، حيث تختلف توزيعات بيانات التدريب (المصدر) عن توزيعات بيانات الاختبار (الهدف). وقد تم تطوير العديد من النماذج لمعالجة هذه المشكلة، وقد أظهرت نماذج المحولات البصرية (ViTs) مؤخرًا نتائج واعدة. ومع ذلك، فإن التعقيد العالي وعدد المعاملات القابلة للتدريب الكبير في نماذج ViTs يحد من تطبيقها العملي. هذا يبرز الحاجة إلى نموذج فعّال لا يقلل فقط من عدد المعاملات القابلة للتدريب، بل يسمح أيضًا بتعديل التعقيد حسب الاحتياجات المحددة، مع الحفاظ على أداء مماثل. ولتحقيق ذلك، نقدم في هذا البحث إطارًا فعّالًا للتكيّف غير المُراقب للنطاق (EUDA). يعتمد EUDA على استخدام DINOv2، وهو نموذج ViT ذاتي التعلّم، كمُستخرج للسمات، يتبعه طبقة ضيقة مبسطة مكوّنة من طبقات متصلة بالكامل لتحسين السمات وتعزيز التكيّف النطاقي. علاوةً على ذلك، يستخدم EUDA خسارة التماثل النطاقي التآزري (SDAL)، التي تدمج خسارة الإنتروبيا المتقاطعة (CE) وخسارة الفرق المتوسط الأقصى (MMD)، لموازنة عملية التكيّف من خلال تقليل أخطاء التصنيف في النطاق المصدري مع تحقيق تطابق بين توزيعات النطاقين المصدري والهدف. تُظهر النتائج التجريبية فعالية EUDA في إنتاج نتائج مماثلة لأفضل النماذج الحالية في مجال التكيّف النطاقي، مع عدد معاملات قابلة للتدريب أقل بكثير، تتراوح بين 42% إلى 99.7%. هذا يُظهر قدرة النموذج على التدريب في بيئات محدودة الموارد. يمكن الوصول إلى كود النموذج من خلال: https://github.com/A-Abedi/EUDA.