Trajectory Factory: Tracklet-Spaltung und Wiederherstellung durch tiefes Siamesisches Bi-GRU für die Mehrfachobjektverfolgung

Die Mehrzielverfolgung (MOT) ist eine herausfordernde Aufgabe in komplexen Szenarien wie der Überwachung und dem autonomen Fahren. In dieser Arbeit schlagen wir eine neuartige Tracklet-Verarbeitungsmethode vor, um Tracklets bei Menschenansammlungen oder langfristiger Verdeckung durch Siamese Bi-Gated Recurrent Unit (GRU) zu trennen und wieder zu verbinden. Die Tracklet-Erstellung nutzt Objektmerkmale, die durch CNN und RNN extrahiert werden, um in dünn besiedelten Szenarien hochvertrauenswürdige Tracklet-Kandidaten zu erstellen. Aufgrund von Fehlverfolgungen im Erstellungsprozess werden die Tracklets verschiedener Objekte durch eine bidirektionale GRU in mehrere Unter-Tracklets aufgeteilt. Danach wird eine Siamese GRU-basierte Methode zur Wiederherstellung der Tracklets angewendet, um die Unter-Tracklets, die demselben Objekt zugehören, zu einem vollständigen Trajektorie zusammenzuführen. Zudem extrahieren wir Tracklet-Bilder aus bestehenden MOT-Datensätzen und stellen einen neuen Datensatz vor, um unsere Netzwerke zu trainieren. Der vorgeschlagene Datensatz enthält mehr als 95160 Fußgängerbilder und hat 793 verschiedene Personen darin enthalten. Durchschnittlich gibt es für jede Person 120 Bilder mit Positionen und Größenangaben. Experimentelle Ergebnisse zeigen die Vorteile unseres Modells gegenüber den Stand der Technik Methoden auf MOT16.