WeakSAM: تقسيم أي شيء يلتقي بالتعرف على المستوى الفردي تحت الإشراف الضعيف

التمييز البصري تحت الإشراف الضعيف باستخدام الإشراف غير الدقيق هو مشكلة تعلم حاسمة ومعقدة. يقلل هذا النهج بشكل كبير من تكاليف التسمية البشرية ويعتمد تقليديًا على التعلم متعدد الحالات والتسمية الوهمية. يقدم هذا البحث نظام WeakSAM ويعالج مشاكل الكشف عن الأشياء والتقسيم تحت الإشراف الضعيف (WSOD و WSIS) من خلال استخدام المعرفة العالمية المكتسبة مسبقًا في نموذج الأساس البصري، أي نموذج تقسيم أي شيء (SAM). يعمل نظام WeakSAM على معالجة قصورين حاسمين في إعادة تدريب WSOD التقليدية، وهما عدم اكتمال التسميات الوهمية الحقيقية (PGT) والحالات الضوضائية لـ PGT، عبر إنشاء PGT التكيفي وتقييد منطقة الاهتمام (RoI). كما يعالج مشكلتي الحاجة إلى دفعات والمعرفة الغائبة عن الفئات في نموذج SAM للكشف عن الأشياء والتقسيم التلقائي. تشير نتائجنا إلى أن نظام WeakSAM يتفوق بشكل كبير على الأساليب الرائدة سابقًا في مقاييس WSOD و WSIS بفوارق كبيرة، وهي تحسينات متوسطها 7.4% و 8.5% على التوالي. يمكن الحصول على الكود من الرابط \url{https://github.com/hustvl/WeakSAM}.