Ein robuster Online-Multi-Kamera-Menschenverfolgungssystem mit geometrischer Konsistenz und zustandsbewusster Re-ID-Korrektur

Die Mehrkamera-Verfolgung mehrerer Personen ist eine entscheidende Technologie für Überwachung, Crowd-Management und soziales Verhaltensanalyse, die eine großflächige Überwachung und eine umfassende Erkenntnis komplexer Szenarien mit mehreren Individuen über verschiedene Kamerablickfelder hinweg ermöglicht. Aufgrund starker Verdeckung innerhalb der Szene und erheblicher Unterschiede in den Kameraperspektiven bestehen jedoch hohe Anforderungen an die Zuordnung und Korrelation derselben Zielobjekte zwischen verschiedenen Kameras, insbesondere in Echtzeit-Szenarien. Um diese Herausforderung zu bewältigen, stellen wir ein neuartiges Online-Mehrkamera-Verfolgungssystem für mehrere Personen vor. Dieses System integriert geometrisch konsistente Einschränkungen sowie Erscheinungsbilder der Objekte, wodurch die Verfolgungsgenauigkeit signifikant verbessert wird. Darüber hinaus entwickeln wir eine zustandsbewusste Re-ID-Korrekturmechanik, die Re-ID-Features adaptiv nutzt, um Fehlzuordnungen zwischen Objekten zu korrigieren. Das vorgeschlagene System zeigt eine gute Anpassungsfähigkeit in verschiedenen Szenarien. Es wurde im Track1 der AI City Challenge 2024 evaluiert und erzielte eine HOTA-Score von 67,2175 %, was den zweiten Platz in der Rangliste sicherte. Der Quellcode ist unter folgender URL verfügbar: https://github.com/ZhenyuX1E/PoseTrack