HyperAIHyperAI
منذ 2 أشهر

Crowd-SAM: SAM كمُشغّل ذكي لتحديد الأشياء في المشاهد المزدحمة

Cai, Zhi ; Gao, Yingjie ; Zheng, Yaoyan ; Zhou, Nan ; Huang, Di
Crowd-SAM: SAM كمُشغّل ذكي لتحديد الأشياء في المشاهد المزدحمة
الملخص

في مجال رؤية الحاسوب، يعد اكتشاف الأشياء مهمةً مهمة تجد تطبيقاتها في العديد من السيناريوهات. ومع ذلك، يمكن أن يكون الحصول على تسميات واسعة النطاق تحديًا، خاصة في المشاهد المزدحمة. مؤخرًا، تم اقتراح نموذج "Segment Anything Model" (SAM) كقطّاع قوي بدون معلومات سابقة، حيث يوفر نهجًا جديدًا للمهام الفاصلة للحالات الخاصة. ومع ذلك، غالبًا ما يتم التأثير على دقة وكفاءة SAM وأصنافه عند التعامل مع الأشياء في المشاهد المزدحمة والمغطاة جزئيًا. في هذا البحث، نقدم Crowd-SAM، وهو إطار يعتمد على SAM مصمم لتعزيز أداء SAM في المشاهد المزدحمة والمغطاة جزئيًا بتكاليف قليلة من المعالم القابلة للتعلم وصور مُسمَّى قليلة. نقدم عينة دعوة فعالة (Efficient Prompt Sampler - EPS) وشبكة تمييز الجزء والكل (Part-Whole Discrimination Network - PWD-Net)، مما يعزز اختيار الأقنعة والدقة في المشاهد المزدحمة. رغم بساطته، فإن Crowd-SAM ينافس الطرق الرائدة (State-of-the-Art - SOTA) للكشف عن الأشياء بالرقابة الكاملة في عدة مقاييس بما فيها CrowdHuman وCityPersons. شفرتنا متاحة على الرابط https://github.com/FelixCaae/CrowdSAM.

Crowd-SAM: SAM كمُشغّل ذكي لتحديد الأشياء في المشاهد المزدحمة | أحدث الأوراق البحثية | HyperAI