FPB: Feature Pyramid Branch für Person Re-Identification

Hohe Leistung bei der Personen-Identifikation (Re-ID) erfordert von dem Modell, sowohl die globale Silhouette als auch lokale Details von Personen zu berücksichtigen. Um repräsentativere Merkmale zu extrahieren, ist eine effektive Methode die Nutzung tiefer Netzwerke mit mehreren Zweigen. Allerdings führen die meisten auf mehrfacher Kopie von Teil-Backbone-Strukturen basierenden Methoden typischerweise zu einer erheblichen Steigerung des Rechenaufwands. In diesem Paper stellen wir einen leichten Feature Pyramid Branch (FPB) vor, der Merkmale aus verschiedenen Schichten des Netzwerks extrahiert und diese in einer bidirektionalen Pyramidenstruktur aggregiert. Durch die Kombination mit Aufmerksamkeitsmodulen und unserer vorgeschlagenen Kreuz-Orthogonalitäts-Regularisierung wird die Leistung des Backbone-Netzwerks signifikant verbessert, wobei weniger als 1,5 Mio. zusätzliche Parameter hinzugefügt werden. Ausführliche Experimente auf Standard-Benchmark-Datensätzen zeigen, dass das von uns vorgeschlagene FPB-basierte Modell sowohl deutlich über den aktuellen Stand der Technik hinausweist als auch eine viel geringere Modellkomplexität aufweist. Der FPB greift die Idee des Feature Pyramid Network (FPN), wie sie in etablierten Objektdetektionsmethoden verwendet wird, auf. So weit wir wissen, ist dies die erste erfolgreiche Anwendung einer ähnlichen Struktur in Aufgaben der Personen-Identifikation, was empirisch belegt, dass Pyramiden-Netzwerke als ergänzende Zweige potenziell geeignete Strukturen für verwandte Merkmals-Embedding-Modelle darstellen können. Der Quellcode ist öffentlich unter https://github.com/anocodetest1/FPB.git verfügbar.