اكتشاف الكائنات البارزة بدون إشراف باستخدام التصويت العنقودي الطيفي

في هذا البحث، نواجه المهمة الصعبة للكشف عن الأشياء البارزة دون إشراف (Unsupervised Salient Object Detection - SOD) من خلال الاستفادة من التجميع الطيفي على الخصائص الذاتية الإشرافية. ونقدم المساهمات التالية: (i) نعيد النظر في التجميع الطيفي ونظهر إمكاناته في تجميع بيكسلات الأشياء البارزة؛ (ii) بالنظر إلى اقتراحات الأقنعة الناتجة عن تطبيقات متعددة للتجميع الطيفي على خصائص الصور المحسوبة من نماذج ذاتية الإشراف مختلفة، مثل MoCov2، SwAV، DINO، نقترح آلية تصويت بسيطة ولكن فعالة "الفائز يأخذ كل شيء" لاختيار الأقنعة البارزة، مع الاستفادة من أولويات الأشياء بناءً على الإطار والتميز؛ (iii) باستخدام تقسيم الكائن المختار كأقنعة أرضية شبه حقيقية (Pseudo Groundtruth Masks)، ندرب كاشفًا للأجسام البارزة يُطلق عليه اسم SelfMask، والذي يتفوق على الأساليب السابقة في ثلاثة مقاييس لكشف الأجسام البارزة دون إشراف. الرمز البرمجي متاح بشكل عام على الرابط https://github.com/NoelShin/selfmask.