Online Multi-camera People Tracking mit räumlich-zeitlichem Mechanismus und hierarchischer Clustering von Anchor-Features

Multi-Camera-Multi-Object-Tracking (MTMC) übertrifft die herkömmliche Einzelkamerabeobachtung, indem es eine nahtlose Objektverfolgung über mehrere Kameras hinweg ermöglicht. Diese Fähigkeit ist entscheidend für Sicherheitssysteme und die Verbesserung der situativen Wahrnehmung in verschiedenen Umgebungen. In diesem Artikel wird ein neuartiges MTMC-Framework vorgestellt, das für den Online-Betrieb konzipiert ist. Das Framework setzt sich aus einem dreistufigen Pipeline-System zusammen: Multi-Object-Tracking (MOT), Multi-Target-Multi-Camera-Tracking (MTMC) und Cross-Interval-Synchronisation (CIS). Im MOT-Schritt werden ReID-Features extrahiert und lokalisierte Tracklets erstellt. Im MTMC-Schritt werden diese Tracklets mithilfe räumlich-zeitlicher Einschränkungen sowie hierarchischer Clusterung mit Anchor-Features über die Kameras hinweg verknüpft, um die Assoziation zwischen Kameras zu verbessern. Schließlich sorgt das CIS-Verfahren dafür, dass die Tracklets über zeitliche Intervalle hinweg temporal konsistent bleiben. Das vorgeschlagene Framework erzielt eine robuste Tracking-Leistung, die anhand der anspruchsvollen AI City Challenge 2024 validiert wurde, wobei ein HOTA-Score von 51,0556 % erreicht wurde, was den sechsten Platz darstellt. Der Quellcode ist unter folgender Adresse verfügbar: https://github.com/AI-and-Robotics-Ventures/AIC2024_Track1_ARV