Ein robuster Online-Multi-Kamera-Menschenverfolgungssystem mit geometrischer Konsistenz und zustandsbewusster Re-ID-Korrektur
{Xiao Ma Yang Zhang Yihang Chen Yuang Zhang Wenjie Yang Zelin Ni Zhenyu Xie}

Abstract
Die Mehrkamera-Verfolgung mehrerer Personen ist eine entscheidende Technologie für Überwachung, Crowd-Management und soziales Verhaltensanalyse, die eine großflächige Überwachung und eine umfassende Erkenntnis komplexer Szenarien mit mehreren Individuen über verschiedene Kamerablickfelder hinweg ermöglicht. Aufgrund starker Verdeckung innerhalb der Szene und erheblicher Unterschiede in den Kameraperspektiven bestehen jedoch hohe Anforderungen an die Zuordnung und Korrelation derselben Zielobjekte zwischen verschiedenen Kameras, insbesondere in Echtzeit-Szenarien. Um diese Herausforderung zu bewältigen, stellen wir ein neuartiges Online-Mehrkamera-Verfolgungssystem für mehrere Personen vor. Dieses System integriert geometrisch konsistente Einschränkungen sowie Erscheinungsbilder der Objekte, wodurch die Verfolgungsgenauigkeit signifikant verbessert wird. Darüber hinaus entwickeln wir eine zustandsbewusste Re-ID-Korrekturmechanik, die Re-ID-Features adaptiv nutzt, um Fehlzuordnungen zwischen Objekten zu korrigieren. Das vorgeschlagene System zeigt eine gute Anpassungsfähigkeit in verschiedenen Szenarien. Es wurde im Track1 der AI City Challenge 2024 evaluiert und erzielte eine HOTA-Score von 67,2175 %, was den zweiten Platz in der Rangliste sicherte. Der Quellcode ist unter folgender URL verfügbar: https://github.com/ZhenyuX1E/PoseTrack
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| multi-object-tracking-on-2024-ai-city | SJTU-Lenovo | AssA: 55.06 DetA: 84.03 HOTA: 67.22 LocA: 93.82 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.