تعقب عدة أشخاص في الوقت الحقيقي باستخدام اختيار المرشحين المتعلم بعمق وإعادة تحديد الشخص

تعتبر متابعة الأهداف المتعددة عبر الإنترنت مشكلة أساسية في تطبيقات تحليل الفيديو الحرجة من الناحية الزمنية. أحد التحديات الرئيسية في الإطار الشائع لمتابعة الأهداف عن طريق الكشف هو كيفية ربط نتائج الكشف غير الموثوقة بالمسارات الموجودة. تقترح هذه الورقة البحثية التعامل مع الكشف غير الموثوق به من خلال جمع المرشحين من مخرجات كل من الكشف والمتابعة. الفكرة الأساسية وراء إنشاء مرشحين زائدين هي أن نتائج الكشف والمسارات يمكن أن يكمل بعضها البعض في سيناريوهات مختلفة. تمنع نتائج الكشف ذات الثقة العالية الانحرافات الطويلة الأمد في المتابعة، ويمكن للتنبؤات المتعلقة بالمسارات التعامل مع الضوضاء الناجمة عن الكشف بسبب الاختفاء (occlusion). لتطبيق الاختيار الأمثل من عدد كبير من المرشحين في الوقت الحقيقي، نقدم دالة تقييم جديدة تعتمد على شبكة عصبية متكررة بالكامل، والتي تشترك في معظم الحسابات على الصورة بأكملها. بالإضافة إلى ذلك، نعتمد تمثيلًا بصريًا تم تعلمه بعمق، وهو مدرب على قواعد بيانات كبيرة لتحديد الهوية الشخصية، لتحسين قدرة متبعتنا على التعرف. أظهرت التجارب الواسعة أن متبعتنا تحقق أداءً حيويًا وفي طليعة التقنية على مقاييس تتبع الأشخاص الأكثر استخدامًا.