Verbesserung der Person-Wiedererkennung durch Attribut- und Identitätslernen

Personen-Wiedererkennung (Re-ID) und Attribut-Erkennung haben das gemeinsame Ziel, Beschreibungen von Fußgängern zu lernen. Ihr Unterschied liegt in der Feinheit der Betrachtung. Die meisten existierenden Re-ID-Methoden berücksichtigen nur die Identitätskennzeichnungen der Fußgänger. Wir haben jedoch festgestellt, dass die Attribute, die detaillierte lokale Beschreibungen enthalten, hilfreich sind, um dem Re-ID-Modell das Erlernen differenzierter Merkmalsrepräsentationen zu ermöglichen. In dieser Arbeit schlagen wir ein Attribut-Personen-Erkennungsnetzwerk (APR) vor, ein Multi-Task-Netzwerk, das sowohl eine Re-ID-Embedding als auch gleichzeitig die Attribute von Fußgängern vorhersagt. Wir haben manuell Attributkennzeichnungen für zwei große Re-ID-Datensätze annotiert und untersuchen systematisch, wie sich Personen-Wiedererkennung und Attribut-Erkennung gegenseitig ergänzen. Darüber hinaus gewichten wir die Attributvorhersagen neu, indem wir Abhängigkeiten und Korrelationen zwischen den Attributen berücksichtigen. Die experimentellen Ergebnisse auf zwei großen Re-ID-Benchmarks zeigen, dass APR durch das Erlernen einer differenzierteren Repräsentation wettbewerbsfähige Re-ID-Leistungen im Vergleich zu den aktuellen besten Methoden erzielt. Mit APR können wir den Suchprozess zehnmal beschleunigen, wobei der Genauigkeitsverlust auf Market-1501 nur 2,92 % beträgt. Zudem wenden wir APR auch auf die Aufgabe der Attribut-Erkennung an und zeigen Verbesserungen gegenüber den Baselines.