SparseTrack: Multi-Object Tracking durch Durchführung einer Szenenzerlegung basierend auf Pseudo-Tiefe

Die Erforschung robuster und effizienter Assoziationsmethoden stellt stets eine zentrale Herausforderung im mehrfachen Objektverfolgungsansatz (Multiple-Object Tracking, MOT) dar. Obwohl bestehende Verfolgungsmethoden beeindruckende Leistungen erzielt haben, bleiben Stauungen und häufige Verdeckungen weiterhin herausfordernde Probleme im Bereich der mehrfachen Objektverfolgung. Wir zeigen, dass die Durchführung einer sparsen Zerlegung in dichten Szenen ein entscheidender Schritt zur Verbesserung der Assoziation verdeckter Objekte ist. Dazu schlagen wir eine Methode zur Schätzung einer Pseudotiefe vor, um die relative Tiefe von Objekten aus 2D-Bildern zu ermitteln. Zudem entwerfen wir einen Algorithmus namens Depth Cascading Matching (DCM), der die gewonnenen Tiefeninformationen nutzt, um eine dichte Menge an Objekten in mehrere spärliche Teilmengen zu zerlegen und diese anschließend von nah nach fern zu verfolgen. Durch die Integration der Pseudotiefenschätzung und der DCM-Strategie in den Assoziationsprozess entwickeln wir einen neuen Tracker namens SparseTrack. SparseTrack bietet einen neuen Ansatz zur Lösung der herausfordernden Aufgabe der Objektverfolgung in überfüllten Szenen. Mit lediglich der IoU-Assoziation erreicht SparseTrack Leistungen, die mit den derzeit besten (SOTA) Methoden auf den Benchmarks MOT17 und MOT20 vergleichbar sind. Der Quellcode und die Modelle sind öffentlich unter \url{https://github.com/hustvl/SparseTrack} verfügbar.