MambaMOT: Zustandsraummodell als Bewegungsvorhersager für die Mehrobjektverfolgung

Im Bereich des Multi-Object-Tracking (MOT) stützen sich herkömmliche Methoden häufig auf den Kalman-Filter zur Bewegungsvorhersage und nutzen dessen Stärken in linearen Bewegungsszenarien. Doch die inhärenten Grenzen dieser Ansätze werden deutlich, wenn sie komplexen, nichtlinearen Bewegungen und Verdeckungen gegenüberstehen, wie sie in dynamischen Umgebungen wie Sport- oder Tanzaufnahmen häufig auftreten. In dieser Arbeit wird untersucht, inwieweit der Kalman-Filter durch ein lernbasiertes Bewegungsmodell ersetzt werden kann, das die Tracking-Genauigkeit und Anpassungsfähigkeit über die Beschränkungen des Kalman-Filter-basierten Trackers hinaus erheblich verbessert. In dieser Studie zeigen unsere vorgeschlagenen Methoden MambaMOT und MambaMOT+ herausragende Leistung auf anspruchsvollen MOT-Datensätzen wie DanceTrack und SportsMOT und demonstrieren ihre Fähigkeit, komplexe, nichtlineare Bewegungsmuster sowie häufige Verdeckungen effektiver zu bewältigen als traditionelle Ansätze.