التفصيل الدلالي شبه المراقب باستخدام شبكة توطين الأخطاء

يدرس هذا البحث التعلم شبه المراقب للتقسيم الدلالي، والذي يفترض أن جزءًا صغيرًا فقط من صور التدريب مُعلّمة، بينما تبقى باقي الصور غير مُعلّمة. تُعطى الصور غير المُعلّمة عادةً تسميات افتراضية (Pseudo labels) لاستخدامها في التدريب، لكن هذا يُعرّض أداء النموذج لخطر التدهور بسبب التحيّز التأكيدية تجاه الأخطاء في التسميات الافتراضية. نقدّم طريقة جديدة تحل هذه المشكلة المزمنة في التسمية الافتراضية. تكمن القوة الأساسية في طريقتنا في شبكة تحديد الأخطاء (Error Localization Network - ELN)، وهي وحدة مساعدة تأخذ الصورة والتنبؤ بالتقسيم كمدخلات، وتمكّن من تحديد البكسلات التي من المرجح أن تكون تسمياتها الافتراضية خاطئة. تتيح ELN للتعلم شبه المراقب أن يكون مقاومًا للاختلالات في التسميات الافتراضية من خلال تجاهل ضجيج التسميات أثناء التدريب، ويمكن دمجها بشكل طبيعي مع استراتيجيات التدريب الذاتي (self-training) والتعلم التبايني (contrastive learning). علاوةً على ذلك، نقدّم استراتيجية تعلّم جديدة لـ ELN، تُحاكي أخطاء تقسيم مُحتملة ومتنوعة أثناء تدريب ELN، مما يعزز قدرتها على التعميم. وقد تم تقييم طريقتنا على مجموعتي البيانات PASCAL VOC 2012 وCityscapes، حيث تفوقت على جميع الطرق الحالية في كل بيئة تقييم.