جلب التعميم إلى اكتشاف المشاة العميق متعدد الآراء

الكشف متعدد الآراء (MVD) فعال للغاية في التعامل مع الإخفاء في بيئات مزدحمة. بينما أحرزت الأعمال الحديثة التي تستخدم التعلم العميق تقدماً كبيراً في هذا المجال، فإنها أغفلت جانب التعميم، مما يجعلها غير عملية للتطبيق الفعلي. النقطة الرئيسية الجديدة في عملنا هي وضع ثلاثة أشكال حاسمة من التعميم واقتراح تجارب لتقييمها: التعميم مع i) عدد متغير من الكاميرات، ii) مواقع كاميرات متغيرة، وأخيرًا iii) إلى مشاهد جديدة. نجد أن النماذج الرائدة الحالية تظهر تعميماً ضعيفاً بسبب الانطباع الزائد على مشهد وكاميرا واحدة. لمعالجة هذه المخاوف: (a) نقترح مجموعة بيانات جديدة معممة للكشف متعدد الآراء (GMVD)، تتضمن مشاهد متنوعة مع تغييرات في وقت النهار، وتوزيعات كاميرات مختلفة، وعدداً متغيراً من الكاميرات، و(b) نناقش الخصائص الأساسية لتحقيق التعميم في MVD ونقترح نموذجاً أساسياً لدمجها. نقوم بمجموعة شاملة من التجارب على مجموعات البيانات WildTrack وMultiViewX والGMVD لتبرير الضرورة لتقييم قدرات التعميم للطرق MVD وإظهار فعالية النهج المقترح. يمكن العثور على الشفرة والمجموعة البيانات المقترحة في https://github.com/jeetv/GMVD