Command Palette
Search for a command to run...
Fußgänger-Ausrichtungsnetzwerk für große Skalen Personen-Wiedererkennung
Fußgänger-Ausrichtungsnetzwerk für große Skalen Personen-Wiedererkennung
Zheng Zhedong Zheng Liang Yang Yi
Zusammenfassung
Die Person-Identifikation (Person re-identification, Person re-ID) wird in der Regel als ein Problem der Bildretrieval-Bewertung betrachtet. Ziel dieser Aufgabe ist es, eine bestimmte Person in einer großen Bild-Datenbank zu finden. In der Praxis verwendet man zur Erzielung von geschnittenen Abbildungen von Fußgängern meist automatische Detektoren. Dieser Prozess leidet jedoch unter zwei Arten von Detektionsfehlern: übermäßiger Hintergrund und fehlende Körperteile. Beide Fehler verschlechtern die Qualität der Ausrichtung von Fußgängern und können die Zuordnung von Personen beeinträchtigen, insbesondere aufgrund von Veränderungen in Position und Skalierung. Um das Problem der Fehlausrichtung zu lösen, schlagen wir vor, die Ausrichtung aus einem Identifikationsprozess zu lernen. Wir führen das Fußgänger-Ausrichtungsnetzwerk (Pedestrian Alignment Network, PAN) ein, das eine differenzierende Embedding-Lernung sowie die Ausrichtung von Fußgängern ohne zusätzliche Annotationen ermöglicht. Unser zentrales Observationsergebnis ist, dass ein convolutionales neuronales Netzwerk (CNN), wenn es lernt, verschiedene Identitäten zu unterscheiden, typischerweise starke Aktivierungen auf dem menschlichen Körper und nicht auf dem Hintergrund zeigt. Das vorgeschlagene Netzwerk nutzt daher diese Aufmerksamkeitsmechanik, um die Position und Ausrichtung von Fußgängern innerhalb eines Begrenzungsrechtecks adaptiv zu bestimmen. Visuelle Beispiele zeigen, dass Fußgänger mit PAN besser ausgerichtet werden. Experimente an drei großen re-ID-Datensätzen bestätigen, dass PAN die differenzierende Fähigkeit der Merkmals-Embeddings verbessert und Ergebnisse erzielt, die mit den besten aktuellen Methoden vergleichbar sind.