التعلم النمطي المتبقي للكشف عن التوزيعات غير المدمجة على مستوى البكسل في التجزئة الدلالية

تنقسم نماذج التجزئة الدلالية (Semantic Segmentation Models) بكسلات إلى مجموعة من الفئات البصرية المعروفة («داخل التوزيع»). عند نشر هذه النماذج في بيئة مفتوحة، تعتمد موثوقيتها على قدرتها ليس فقط على تصنيف البكسلات داخل التوزيع، بل أيضًا على اكتشاف البكسلات الخارجة عن التوزيع (OoD). وعلى مدار التاريخ، أدت أداءً ضعيفًا في اكتشاف البكسلات الخارجة عن التوزيع إلى تطوير أساليب تعتمد على إعادة تدريب النموذج باستخدام صور تدريب اصطناعية تتضمن كائنات بصرية خارجة عن التوزيع. وعلى الرغم من نجاح هذه الأساليب، إلا أنها تواجه مشكلتين رئيسيتين: (1) قد تنخفض دقة التجزئة داخل التوزيع أثناء عملية إعادة التدريب؛ و(2) لا تُظهر دقة اكتشاف البكسلات الخارجة عن التوزيع أداءً عامًا جيدًا في سياقات جديدة (مثل البيئات الريفية) خارج مجموعة التدريب (مثل البيئات الحضرية). في هذا البحث، نعالج هاتين المشكلتين من خلال: (أ) وحدة جديدة تُسمى «تعلم النمط المتبقي» (RPL) التي تساعد نموذج التجزئة على اكتشاف البكسلات الخارجة عن التوزيع دون التأثير على أداء التجزئة للبكسلات داخل التوزيع؛ و(ب) تعلم تبايني مبتكر يُسمى «CoroCL» (التعلم التبايني المقاوم للسياق)، والذي يُعزز قدرة وحدة RPL على اكتشاف البكسلات الخارجة عن التوزيع بشكل موثوق عبر مختلف السياقات. يُظهر نهجنا تحسنًا بحوالي 10% في معدل الخطأ الإيجابي الكاذب (FPR) و7% في معامل أداء التصنيف المحسّن (AuPRC) مقارنةً بأفضل النماذج السابقة على مجموعات بيانات Fishyscapes وSegment-Me-If-You-Can وRoadAnomaly. يمكن الوصول إلى الكود الخاص بنا عبر الرابط التالي: https://github.com/yyliu01/RPL.