HyperAIHyperAI
منذ 11 أيام

التعلم النمطي المتبقي للكشف عن التوزيعات غير المدمجة على مستوى البكسل في التجزئة الدلالية

Yuyuan Liu, Choubo Ding, Yu Tian, Guansong Pang, Vasileios Belagiannis, Ian Reid, Gustavo Carneiro
التعلم النمطي المتبقي للكشف عن التوزيعات غير المدمجة على مستوى البكسل في التجزئة الدلالية
الملخص

تنقسم نماذج التجزئة الدلالية (Semantic Segmentation Models) بكسلات إلى مجموعة من الفئات البصرية المعروفة («داخل التوزيع»). عند نشر هذه النماذج في بيئة مفتوحة، تعتمد موثوقيتها على قدرتها ليس فقط على تصنيف البكسلات داخل التوزيع، بل أيضًا على اكتشاف البكسلات الخارجة عن التوزيع (OoD). وعلى مدار التاريخ، أدت أداءً ضعيفًا في اكتشاف البكسلات الخارجة عن التوزيع إلى تطوير أساليب تعتمد على إعادة تدريب النموذج باستخدام صور تدريب اصطناعية تتضمن كائنات بصرية خارجة عن التوزيع. وعلى الرغم من نجاح هذه الأساليب، إلا أنها تواجه مشكلتين رئيسيتين: (1) قد تنخفض دقة التجزئة داخل التوزيع أثناء عملية إعادة التدريب؛ و(2) لا تُظهر دقة اكتشاف البكسلات الخارجة عن التوزيع أداءً عامًا جيدًا في سياقات جديدة (مثل البيئات الريفية) خارج مجموعة التدريب (مثل البيئات الحضرية). في هذا البحث، نعالج هاتين المشكلتين من خلال: (أ) وحدة جديدة تُسمى «تعلم النمط المتبقي» (RPL) التي تساعد نموذج التجزئة على اكتشاف البكسلات الخارجة عن التوزيع دون التأثير على أداء التجزئة للبكسلات داخل التوزيع؛ و(ب) تعلم تبايني مبتكر يُسمى «CoroCL» (التعلم التبايني المقاوم للسياق)، والذي يُعزز قدرة وحدة RPL على اكتشاف البكسلات الخارجة عن التوزيع بشكل موثوق عبر مختلف السياقات. يُظهر نهجنا تحسنًا بحوالي 10% في معدل الخطأ الإيجابي الكاذب (FPR) و7% في معامل أداء التصنيف المحسّن (AuPRC) مقارنةً بأفضل النماذج السابقة على مجموعات بيانات Fishyscapes وSegment-Me-If-You-Can وRoadAnomaly. يمكن الوصول إلى الكود الخاص بنا عبر الرابط التالي: https://github.com/yyliu01/RPL.

التعلم النمطي المتبقي للكشف عن التوزيعات غير المدمجة على مستوى البكسل في التجزئة الدلالية | أحدث الأوراق البحثية | HyperAI