تعقب رؤوس الأشخاص في الحشد الكثيف

تعقب البشر في مقاطع الفيديو المزدحمة هو عنصر مهم في فهم المشهد البصري. زيادة كثافة الحشود تشكل تحديًا لرؤية الأفراد، مما يحد من قابلية توسيع مُتعقبات المشاة الحالية إلى كثافات حشود أعلى. لذلك، نقترح إعادة إحياء تعقب الرؤوس باستخدام مجموعة بيانات "Crowd of Heads Dataset" (CroHD)، والتي تتكون من 9 سلاسل بصرية تحتوي على 11,463 إطارًا مع أكثر من 2,276,838 رأسًا و5,230 مسارًا تم توثيقها في مشاهد متنوعة. للتقدير، اقترحنا مؤشرًا جديدًا، IDEucl، لقياس فعالية الخوارزمية في الحفاظ على هوية فريدة لأطول فترة ممكنة في الفضاء الإحداثي للصورة، مما يبني علاقة بين حركة حشد المشاة وأداء خوارزمية التعقب. بالإضافة إلى ذلك، نقترح أيضًا كاشف رؤوس جديد يُدعى "HeadHunter"، والذي تم تصميمه لاكتشاف الرؤوس الصغيرة في المشاهد المزدحمة. نوسع نطاق "HeadHunter" بإضافة مرشح جزيئي (Particle Filter) ووحدة إعادة التعرف المستندة إلى توزيع الألوان (color histogram) لتعقب الرؤوس. لإنشاء هذا الأساس القوي، نقارن مُتعقبنا مع أحدث مُتعقبات المشاة الموجودة على مجموعة بيانات CroHD ونبين تفوقه، خاصةً في مؤشرات الحفاظ على الهوية. بفضل الكاشف الخفيف الوزن والمُتعقب الفعال في الحفاظ على الهوية، نعتقد أن إسهاماتنا ستكون مفيدة في تقدم تعقب المشاة ضمن الحشود الكثيفة.