Effiziente Online-Mehrkamerasverfolgung mit speichereffizienten akkumulierten Erscheinungseigenschaften und Trajektorienvalidierung

Die Mehrkameraverfolgung (Multi-camera Tracking, MCT) spielt eine entscheidende Rolle in zahlreichen Anwendungen des Computersehens. Die präzise Verfolgung von Individuen über mehrere Kameras steht jedoch vor Herausforderungen, insbesondere hinsichtlich identitätsbedingter Wechsel (ID switches). In diesem Artikel stellen wir ein effizientes Online-MCT-System vor, das diese Probleme durch Online-Verarbeitung adressiert. Unser System nutzt speichereffiziente akkumulierte Erscheinungsbilder (appearance features), um stabile Darstellungen von Individuen über Kameras und Zeiträume hinweg bereitzustellen. Durch die Integration einer Trajektorienvalidierung mittels hierarchischer agglomerativer Clustering (HAC) in überlappenden Bereichen können ID-Wechsel identifiziert und korrigiert werden. Die Evaluierung am Datensatz der 2024 AI City Challenge Track 1 [39] zeigt die wettbewerbsfähige Leistung unseres Systems, das sowohl in überlappenden als auch in nicht überlappenden Kameranetzwerken präzise Verfolgung ermöglicht. Mit einem HOTA-Score von 40,3 % [29] erreichte unser System den 9. Platz in der Herausforderung. Die Integration der Trajektorienvalidierung verbessert die Leistung gegenüber der Baseline um 8 %, während die akkumulierten Erscheinungsbilder zusätzliche 17 % Leistungssteigerung ermöglichen.