Fahrzeug-Wiedererkennung mit quadrupelrichtigen tiefen Lernmerkmalen

Um den negativen Einfluss von Blickwinkelvariationen zu mindern und die Leistungsfähigkeit der Fahrzeug-Wiedererkennung zu verbessern, haben wir quadrupelrichtige Tiefenlernnetze entwickelt, um quadrupelrichtige tiefenlernbasierte Merkmale (QD-DLF) von Fahrzeugbildern zu extrahieren. Die quadrupelrichtigen Tiefenlernnetze haben eine ähnliche Gesamtarchitektur, einschließlich derselben grundlegenden Tiefenlernarchitektur, aber unterschiedliche Richtungsmerkmals-Pooling-Schichten. Insbesondere ist die gleiche grundlegende Tiefenlernarchitektur ein kurz und dicht verbundenes Faltungsneuronales Netzwerk (Convolutional Neural Network, CNN), das im ersten Schritt grundlegende Merkmalskarten eines eingegebenen quadratischen Fahrzeugbildes extrahiert. Anschließend nutzen die quadrupelrichtigen Tiefenlernnetze verschiedene Richtungs-Pooling-Schichten, nämlich die horizontale Durchschnittspooling-Schicht (Horizontal Average Pooling, HAP), die vertikale Durchschnittspooling-Schicht (Vertical Average Pooling, VAP), die diagonale Durchschnittspooling-Schicht (Diagonal Average Pooling, DAP) und die antidiagonale Durchschnittspooling-Schicht (Anti-Diagonal Average Pooling, AAP), um die grundlegenden Merkmalskarten in horizontale, vertikale, diagonale und antidiagonale Richtungsmerkmalskarten zu komprimieren.Schließlich werden diese Richtungsmerkmalskarten räumlich normalisiert und zusammengefügt, um als quadrupelrichtiges tiefenlernbasiertes Merkmal für die Fahrzeug-Wiedererkennung zu dienen. Ausführliche Experimente auf den Datenbanken VeRi und VehicleID zeigen, dass der vorgeschlagene Ansatz QD-DLF mehrere state-of-the-art Methoden der Fahrzeug-Wiedererkennung übertrifft.