عد الأشياء وتقسيم النماذج مع إشراف على مستوى الصورة

عد الأشياء الشائعة في مشهد طبيعي هو مشكلة صعبة في رؤية الحاسوب لها تطبيقات عديدة في العالم الحقيقي. النهج الحالي لعد الأشياء الشائعة على مستوى الصورة يتنبأ فقط بعدد الأشياء العالمي ويعتمد على إشراف إضافي على مستوى المثال لتحديد مواقع الأشياء. نقترح نهجًا مشرفًا على مستوى الصورة يوفر عدد الأشياء العالمي وتوزيعها المكاني للمثاليات من خلال بناء خريطة كثافة فئات الأشياء. مستوحى من الدراسات النفسية، نقوم أيضًا بتقليل الإشراف على مستوى الصورة باستخدام معلومات محدودة عن عدد الأشياء (حتى أربعة). حسب علمنا، نحن أول من اقترح تقدير الخريطة الكثيفة المشرف عليها على مستوى الصورة لعد الأشياء الشائعة وأظهر فعاليتها في التقطيع المشرف عليه على مستوى الصورة. تم إجراء تجارب شاملة على قواعد بيانات PASCAL VOC و COCO. يتفوق نهجنا على الأساليب الموجودة، بما في ذلك تلك التي تستعمل الإشراف على مستوى المثال، في كلتا قاعدة البيانات لعد الأشياء الشائعة. بالإضافة إلى ذلك، يحسن نهجنا أحدث التقنيات للتقطيع المشرف عليه على مستوى الصورة بنسبة زيادة نسبية تبلغ 17.8% من حيث المتوسط الأفضل للتقاطع، في قاعدة بيانات PASCAL VOC 2012.رابط الكود: https://github.com/GuoleiSun/CountSeg