HyperAIHyperAI
منذ 2 أشهر

R-CNN مع الوعي بالإغلاق: كشف المشاة في الحشد

Shifeng Zhang; Longyin Wen; Xiao Bian; Zhen Lei; Stan Z. Li
R-CNN مع الوعي بالإغلاق: كشف المشاة في الحشد
الملخص

اكتشاف المشاة في المشاهد المزدحمة هو مشكلة صعبة نظرًا لأن المشاة غالبًا ما يجتمعون معًا ويحجبون بعضهم البعض. في هذا البحث، نقترح طريقة جديدة لـ R-CNN (OR-CNN) تهدف إلى تحسين دقة الاكتشاف في الأماكن المزدحمة. بشكل خاص، قمنا بتصميم خسارة جديدة للجمع (aggregation loss) لضمان أن تكون الاقتراحات قريبة ومكثفة من الأشياء المرتبطة بها. وفي الوقت نفسه، نستخدم وحدة جمع جديدة تدرك حجب الأجزاء (Part Occlusion-Aware Region of Interest (PORoI)) لتحل محل طبقة جمع RoI من أجل دمج معلومات البنية السابقة للجسم البشري مع التنبؤ بالرؤية في الشبكة للتعامل مع الحجب. يتم تدريب كاشفنا بطريقة شاملة من النهاية إلى النهاية، مما يحقق أفضل النتائج على ثلاثة مجموعات بيانات لاكتشاف المشاة، وهي CityPersons وETH وINRIA، ويقدم أداءً مماثلًا لأفضل التقنيات الحالية على مجموعة بيانات Caltech.

R-CNN مع الوعي بالإغلاق: كشف المشاة في الحشد | أحدث الأوراق البحثية | HyperAI