تعلم التجميع للتفصيل المثلي بدون اقتراحات

هذا العمل اقترح هدف تعلم جديد لتدريب شبكة عصبية عميقة على أداء التجميع النقطي للصورة من البداية إلى النهاية. تم تطبيق هذا النهج على تقسيم المثيلات، وهو مجال يجمع بين تقسيم الصور الدلالي وتحديد الأشياء. نحن نستفيد من الخاصية الأساسية الأكثر أهمية في تصنيف المثيلات -- العلاقة الثنائية بين النقاط البؤرية -- كإشراف لصياغة هدف التعلم، ثم نطبقه لتدريب شبكة تلافيفية كاملة (FCN) على التعلم لأداء التجميع النقطي. يمكن استخدام المجموعات الناتجة مباشرةً كتصنيف للمثيلات. لدعم تصنيف عدد غير محدود من المثيلات، قمنا بدمج أفكار من نظرية تلوين الرسوم البيانية في الهدف المقترح للتعلم. أظهرت التقييمات على مجموعة بيانات Cityscapes أداءً قوياً، مما يثبت صحة الفكرة. بالإضافة إلى ذلك، حازت نهجتنا على المركز الثاني في مسابقة الكشف عن المسارات ضمن تحدي القيادة الذاتية في مؤتمر CVPR لعام 2017، وكانت أفضل أداء دون استخدام بيانات خارجية.