تتبع متعدد الكاميرات في الوقت الفعلي بكفاءة باستخدام ميزات مظهر مُجمعة فعالة من حيث الذاكرة وتحقق من المسار

يلعب التتبع متعدد الكاميرات (MCT) دورًا حاسمًا في مجموعة واسعة من تطبيقات الرؤية الحاسوبية. ومع ذلك، يواجه التتبع الدقيق للأفراد عبر كاميرات متعددة تحديات، خصوصًا فيما يتعلق بتحويل الهوية. في هذه الورقة، نقدم نظامًا فعّالًا للتشغيل الفوري (online) في التتبع متعدد الكاميرات، يتعامل مع هذه التحديات من خلال المعالجة الفورية. يستخدم نظامنا ميزات ظاهرية مجمعة كفؤة من حيث الذاكرة لتوفير تمثيلات مستقرة للأفراد عبر الكاميرات والزمن. وباستخدام التحقق من المسارات عبر تجميع تسلسلي هرمي (HAC) في المناطق المتداخلة، يتم تحديد وتصحيح عمليات نقل الهوية. أظهرت التجارب على مجموعة بيانات AI City Challenge 2024، المسار 1 [39]، أداءً تنافسيًا متميزًا، حيث حقق التتبع الدقيق في شبكات كاميرات متداخلة وغير متداخلة على حد سواء. وبلغت درجة الأداء (HOTA) 40.3% [29]، مما جعل نظامنا يحتل المرتبة التاسعة في التحدي. كما أدى دمج التحقق من المسارات إلى تحسين الأداء بنسبة 8% مقارنة بالأساس، في حين ساهمت الميزات الظاهرية المجمعة بشكل إضافي في تحسين أداء النظام بنسبة 17%.