التمييز بين الحالات بشكل ضعيف الإشراف عبر التعلم بدون تمييز بين الفئات باستخدام الصور البارزة

يتمتع البشر بقدرة قوية على تقسيم الأشياء دون اعتبار للصنف (class-agnostic object segmentation) ويمكنهم رسم حدود الأشياء غير المعروفة بدقة، مما يحثنا على اقتراح حل يستند إلى تقسيم الأشياء دون اعتبار للصنف تحت إشراف الصناديق (BoxCaseg) لتقسيم النماذج بشكل ضعيف بالإشراف. يتم تدريب نموذج BoxCaseg بشكل مشترك باستخدام صور تحت إشراف الصناديق وصور بارزة في إطار التعلم متعدد المهام. تقدم الصور البارزة التي تم توضيحها بدقة إرشادات لموقع الأشياء دون اعتبار للصنف للصور تحت إشراف الصناديق. يتم تحسين أقنعة الأشياء التي يتوقعها نموذج BoxCaseg المدرب مسبقًا من خلال استراتيجية دمج وإسقاط جديدة كحقيقة أرضية بالنيابة لتدريب Mask R-CNN لتقسيم النماذج بشكل ضعيف بالإشراف. باستخدام فقط 7991 صورة بارزة، يكون Mask R-CNN الذي يتم تدريبه بشكل ضعيف بالإشراف مكافئًا لنظيره الذي يتم تدريبه بشكل كامل بالإشراف على PASCAL VOC ويتفوق بشكل كبير على أفضل الأساليب السابقة لإشراف الصناديق في تقسيم النماذج على COCO. يمكن الحصول على الكود المصدر والنماذج المدربة مسبقًا والقواعد البيانات من \url{https://github.com/hustvl/BoxCaseg}.