Detektionserholung im Online-Mehrobjektverfolgung mit Sparse-Graph-Tracker

Bei bestehenden Methoden zur gleichzeitigen Detektion und Verfolgung werden paarweise relationale Merkmale verwendet, um vorherige Tracklets mit aktuellen Detektionen zu verbinden. Allerdings können diese Merkmale für einen Tracker nicht ausreichend diskriminativ sein, um ein Ziel aus einer großen Anzahl von Detektionen zu identifizieren. Die Auswahl nur hochbewerteter Detektionen für die Verfolgung kann dazu führen, dass Detektionen verpasst werden, deren Konfidenzscore niedrig ist. In der Online-Verarbeitung resultiert dies in Unterbrechungen von Tracklets, die nicht wiederhergestellt werden können. In diesem Zusammenhang stellen wir den Sparse Graph Tracker (SGT) vor, einen neuartigen Online-Graph-Tracker, der höherwertige relationale Merkmale nutzt, die durch Aggregation der Merkmale benachbarter Detektionen und ihrer Beziehungen diskriminativer sind. SGT transformiert Videodaten in einen Graphen, wobei Detektionen, deren Verbindungen und die relationalen Merkmale zweier verbundener Knoten jeweils durch Knoten, Kanten und Kantenmerkmale repräsentiert werden. Die starken Kantenmerkmale ermöglichen es SGT, Ziele zu verfolgen, wobei die Verfolgungskandidaten durch die top-K Detektionen mit großem K ausgewählt werden. Dadurch können auch Detektionen mit niedrigem Score verfolgt werden, und verpasste Detektionen werden ebenfalls wiederhergestellt. Die Robustheit gegenüber der Wahl des K-Werts wird durch umfangreiche Experimente belegt. In den Challenges MOT16/17/20 und HiEve übertrifft SGT die derzeit besten Tracker bei Echtzeit-Inferenzgeschwindigkeit. Insbesondere zeigt SGT eine erhebliche Verbesserung in Bezug auf MOTA in den Challenges MOT20 und HiEve. Der Quellcode ist unter https://github.com/HYUNJS/SGT verfügbar.