HyperAIHyperAI
vor 2 Monaten

Eine Homographie ist alles, was Sie benötigen: GMBV-basierte gemeinsame Schätzung von Homographie und mehreren Objektzuständen

Claasen, Paul Johannes ; de Villiers, Johan Pieter
Eine Homographie ist alles, was Sie benötigen: GMBV-basierte gemeinsame Schätzung von Homographie und mehreren Objektzuständen
Abstract

Ein neuer Online-MOT-Algorithmus, IMM-Gesamthomographiezustandschätzung (IMM-JHSE), wird vorgeschlagen. IMM-JHSE verwendet eine anfängliche Homographieschätzung als einzige zusätzliche 3D-Information, während andere 3D-MOT-Methoden reguläre 3D-Messungen verwenden. Durch die gemeinsame Modellierung der Homographiematrix und ihrer Dynamik als Teil von Spurzustandsvektoren entfernt IMM-JHSE den expliziten Einfluss von Kamerasbewegungskompensationsmethoden auf die vorhergesagten Spurzustände, was in früheren Ansätzen weit verbreitet war. Aufbauend darauf werden statische und dynamische Kamerasbewegungsmodelle unter Verwendung eines IMM-Filters kombiniert. Ein einfaches Bounding-Box-Bewegungsmodell wird verwendet, um die Positionen der Bounding Boxes zu prognostizieren und damit Informationen aus der BildEbene zu integrieren. Neben der Anwendung eines IMM auf die Kamerasbewegung wird ein nicht standardmäßiger IMM-Ansatz angewendet, bei dem Bounding-Box-basierte BIoU-Werte mit bodenbasierten Mahalanobis-Distanzen in einer IMM-artigen Weise gemischt werden, um nur Zuordnungen durchzuführen. Dies macht IMM-JHSE robust gegenüber Bewegungen außerhalb der Bodenebene. Schließlich nutzt IMM-JHSE Techniken zur Schätzung dynamischer Prozess- und Messrauschen. IMM-JHSE verbessert sich im Vergleich zu verwandten Techniken, einschließlich UCMCTrack, OC-SORT, C-BIoU und ByteTrack, auf den DanceTrack- und KITTI-Auto-Datensätzen, wobei HOTA um 2,64 und 2,11 erhöht wird. Gleichzeitig bietet es wettbewerbsfähige Leistungen auf den MOT17-, MOT20- und KITTI-Personen-Datensätzen. Mit öffentlich verfügbaren Detektionen übertrifft IMM-JHSE fast alle anderen 2D-MOT-Methoden und wird nur von einigen 3D-MOT-Methoden – darunter auch solchen, die offline arbeiten – auf dem KITTI-Auto-Datensatz übertroffen. Im Vergleich zu Aufmerksamkeitsbasierten Trackingmethoden zeigt IMM-JHSE bemerkenswert ähnliche Leistungen auf dem DanceTrack-Datensatz und übertrifft sie auf dem MOT17-Datensatz. Der Code ist öffentlich verfügbar: https://github.com/Paulkie99/imm-jhse.