HyperAIHyperAI
منذ 8 أيام

G2L: طريقة محاذاة عالمية إلى محلية للتصنيف الدلالي التكيفي للمنطقة بدون تدريب مشرف

{Thi-Oanh Nguyen, Dinh Viet Sang, Kieu Dang Nam, Nguyen Viet Manh}
الملخص

يهدف التكييف غير المُراقَب للنطاق (UDA) للتقسيم الدلالي إلى نقل المعرفة من مجموعة بيانات مصدرية مُعلّمة بكثافة على مستوى البكسل إلى مجموعة بيانات مستهدفة غير مُعلّمة. ومع ذلك، يعاني أداء منهجيات UDA غالبًا من انزياح النطاق، وهو الفرق بين توزيعات الميزات في النطاقين. وقد تم بذل عدة محاولات لمحاذاة هذه التوزيعات على مستوى الصورة بشكل محدود. ولكن نظرًا لظاهرة انزياح النطاق على مستوى الفئة، فإن هذه المحاذاة الشاملة لا تضمن فصلًا جيدًا للميزات العميقة المستخلصة من فئات مختلفة في النطاق المستهدف. ونتيجة لذلك، قد تكون التسميات الوهمية (pseudo-labels) المُولَّدة ضوضاءً، مما يُفسد عملية التعلّم في النطاق المستهدف. وتركز بعض الطرق الحديثة على تنقية التسميات الوهمية في الوقت الفعلي باستخدام معلومات مُصنفة حسب الفئة. تقدّم هذه الورقة منهجية جديدة لـ UDA تُسمّى المحاذاة من العام إلى الخاص (G2L)، والتي تستخدم تدريبًا مُعاكسًا دقيقًا وتحويل فورييه اللوني الجديد لمعالجة انزياح النطاق على مستوى الصورة من منظور عام. ثم، يتعامل منهجنا مع انزياح النطاق على مستوى الفئة من منظور محلي. وبشكل محدد، نقترح استراتيجية تصنيف الفئات ذات التوزيع الطويل (long-tail category rating)، ونطبّق حدودًا موثوقة ديناميكية ووزنًا تفضيليًا حسب الفئة عند إنشاء التسميات الوهمية وتنقيتها، بهدف دعم الفئات النادرة. وأخيرًا، تُستخدم عملية التَّنقيح الذاتي (self-distillation) لتعزيز نتائج التقسيم النهائية. أظهرت التجارب على معايير شهيرة مثل GTA5 → Cityscapes وSYNTHIA → Cityscapes أن منهجيتنا تحقق أداءً دقيقًا أفضل من الطرق الأخرى المُتقدمة في مجالها.