التعلم شبه المشرف المقاوم للغموض للكشف الكثيف عن الأشياء

باستخدام تقنيات الكشف شبه المشرف (SSOD) الأساسية، يحصل الكاشفون من مرحلة واحدة عمومًا على تحسينات محدودة مقارنة بالusters من مرحلتين. وجدنا تجريبيًا أن السبب الجذري يكمن في نوعين من الغموض: (1) غموض الاختيار حيث تكون العلامات الوهمية المختارة أقل دقة، نظرًا لعدم قدرة درجات التصنيف على تمثيل جودة التحديد بشكل صحيح. (2) غموض التعيين حيث يتم مطابقة العينات مع علامات غير مناسبة أثناء تعيين العلامات الوهمية، بسبب إغفال الأشياء والصناديق الوهمية غير الدقيقة. لمعالجة هذه المشكلات، نقترح تعلمًا شبه مشرف مقاوم للغموض (ARSL) للكاشفين من مرحلة واحدة. تحديدًا، لتخفيض غموض الاختيار، تم اقتراح تقدير الثقة المشترك (JCE) لتقييم جودة التصنيف والتحديد للعلامات الوهمية بشكل مشترك. بالنسبة لغموض التعيين، تم تقديم تعيين الفصل بين المهام (TSA) لتعيين العلامات بناءً على التوقعات على مستوى البكسل بدلاً من الصناديق الوهمية غير الموثوقة. يستخدم استراتيجية "تقسيم وغلبة" ويستغل الإيجابيات بشكل منفصل للمهام الخاصة بالتصنيف والتحديد، مما يجعله أكثر صلابة أمام غموض التعيين. أظهرت التجارب الشاملة أن ARSL يخفف بفعالية من الغموض ويحقق أداءً رائدًا في SSOD على MS COCO و PASCAL VOC. يمكن العثور على الأكواد في https://github.com/PaddlePaddle/PaddleDetection.