Erkundung des räumlichen Signals mittels hybrider pyramidaler Graphen-Netzwerkarchitektur für Fahrzeug-Re-Identifikation

Bekannte Methoden zur Fahrzeug-Weitererkennung (vehicle re-identification) verwenden üblicherweise räumliche Pooling-Operationen, um Merkmalskarten zu aggregieren, die mittels kommerziell erhältlicher Backbone-Netzwerke extrahiert wurden. Dabei wird die räumliche Bedeutung der Merkmalskarten weitgehend ignoriert, was letztendlich die Leistung der Fahrzeug-Weitererkennung beeinträchtigt. In dieser Arbeit wird zunächst ein innovatives räumliches Graph-Netzwerk (Spatial Graph Network, SGN) vorgestellt, das die räumliche Bedeutung der Merkmalskarten präzise erforscht. Das SGN setzt sich aus mehreren räumlichen Graphen (Spatial Graphs, SGs) zusammen. Jeder SG interpretiert die Elemente der Merkmalskarte als Knoten und nutzt räumliche Nachbarschaftsbeziehungen, um die Kanten zwischen den Knoten zu bestimmen. Während des Propagationsprozesses im SGN werden jeder Knoten sowie seine räumlichen Nachbarn innerhalb eines SGs auf den nächsten SG aggregiert. Auf dem folgenden SG wird jeder aggregierte Knoten mit einem lernbaren Parameter neu gewichtet, um die Bedeutung an der entsprechenden Position zu identifizieren. Zweitens wird ein neuartiges pyramidenförmiges Graph-Netzwerk (Pyramidal Graph Network, PGN) entworfen, das die räumliche Bedeutung der Merkmalskarten auf mehreren Skalen umfassend erforscht. Das PGN organisiert mehrere SGNs pyramidenartig, wobei jeder SGN Merkmalskarten einer spezifischen Skala verarbeitet. Schließlich wird ein hybrides pyramidenförmiges Graph-Netzwerk (Hybrid Pyramidal Graph Network, HPGN) entwickelt, indem das PGN hinter einem Backbone-Netzwerk basierend auf ResNet-50 eingebettet wird. Umfassende Experimente an drei großen Fahrzeugdatenbanken (nämlich VeRi776, VehicleID und VeRi-Wild) zeigen, dass das vorgeschlagene HPGN die Leistung von state-of-the-art-Methoden zur Fahrzeug-Weitererkennung übertrifft.