اكتشاف ذيل التوزيع الطويل في تقسيم النماذج باستخدام الرقابة الذاتية الهرمية

التمييز بين النماذج (instance segmentation) هو موضوع نشط في رؤية الحاسوب يتم عادةً حلّه باستخدام نماذج التعلم الإشرافي على مجموعات بيانات ضخمة تتكون من أقنعة على مستوى الكائنات (object level masks). الحصول على مثل هذه المجموعة من البيانات لأي مجال جديد يمكن أن يكون باهظ الثمن ومُستغرقًا للوقت. بالإضافة إلى ذلك، فإن النماذج التي تم تدريبها على فئات معينة مُشَرَّحَة لا تعمم بشكل جيد على الكائنات غير المعروفة. الهدف من هذا البحث هو اقتراح طريقة قادرة على إجراء اكتشاف غير إشرافي لفئات ذيل طويلة (long-tail categories) في التمييز بين النماذج، من خلال تعلم تمثيلات النماذج (instance embeddings) للأقاليم المقنعة. مستفيدين من العلاقات الغنية والهيكل الهرمي بين الكائنات في الصور، نقترح خسائر ذاتية الإشراف لتعلم تمثيلات الأقنعة. بعد التدريب على مجموعة بيانات COCO دون أي توضيحات إضافية للكائنات ذات ذيل طويل، يُمكن لنموذجنا اكتشاف كائنات جديدة وأكثر دقةً من الفئات الشائعة في COCO. نظهر أن النموذج يحقق نتائج كمية تنافسية على LVIS مقارنة بالطرق الإشرافية والجزئية الإشرافية.