التتبع الآني للأشخاص عبر كاميرات متعددة باستخدام آلية مكانية زمنية وتقسيم تسلسلي لسمات المرجع

الملخص
يتخطى التتبع متعدد الكاميرات للكائنات المتعددة (MTMC) التتبع التقليدي باستخدام كاميرا واحدة من خلال تمكين تتبع الكائنات بشكل سلس عبر مشاهد كاميرات متعددة. تُعد هذه القدرة حاسمة لأنظمة الأمان وتحسين الوعي المكاني في بيئات مختلفة. يقترح هذا البحث إطارًا جديدًا لـ MTMC مصمم للعمل في الوقت الفعلي. ويستخدم هذا الإطار نموذجًا ثلاثي المراحل: تتبع الكائنات المتعددة (MOT)، وتتبع الأهداف المتعددة عبر كاميرات متعددة (MTMC)، والتحديث عبر الفواصل الزمنية (CIS). في مرحلة MOT، يتم استخلاص ميزات التعرف على الهوية (ReID) وتكوين شرائط تتبع محلية. تربط مرحلة MTMC هذه الشرائط عبر الكاميرات باستخدام قيود مكانيّة-زمنية وتقنيات تجميع هرميّة قائمة على ميزات مرجعية لتحسين الربط بين الكاميرات. وأخيرًا، تضمن مرحلة CIS الحفاظ على الاتساق الزمني للشرائط عبر الفواصل الزمنية. وقد حقق الإطار المقترح أداءً موثوقًا في التتبع، وتم التحقق منه على تحدي AI City Challenge 2024 الصعب، حيث حصل على درجة HOTA قدرها 51.0556%، مصنّفًا في المرتبة السادسة. يمكن الوصول إلى الكود من خلال: https://github.com/AI-and-Robotics-Ventures/AIC2024_Track1_ARV
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| multi-object-tracking-on-2024-ai-city | ARV | AssA: 48.07 DetA: 54.85 HOTA: 51.06 LocA: 89.61 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.