Stichprobenunabhängige Merkmalsdarstellung für die langfristige Personenwiedererkennung

Die Person-Identifikation über nicht überlappende Kameras ist ein Problem der Identifizierung von Individuen unter Verwendung unterschiedlicher Sensoren. Obwohl erhebliche Fortschritte bei der Lösung dieses Problems erzielt wurden, bleibt es weiterhin herausfordernd aufgrund der visuellen Veränderungen einer und derselben Person sowie der Ähnlichkeit mit anderen Personen. Einige frühere Ansätze versuchten, diese Herausforderungen zu bewältigen, indem sie Merkmale positiver Beispiele von solchen negativer Beispiele trennten. Allerdings hängen die Leistungen bestehender Modelle erheblich von den Eigenschaften und der Verteilung der Trainingsdaten ab. Daher schlagen wir einen neuartigen Ansatz namens Sampling-Independent Robust Feature Representation Network (SirNet) vor, der entkoppelte Merkmalsdarstellungen aus zufällig ausgewählten Proben lernt. Dabei wird eine sorgfältig entworfene sampling-unabhängige maximale Diskrepanzverlustfunktion eingeführt, um Proben derselben Person als Cluster zu modellieren. Dadurch kann das vorgeschlagene Framework zusätzliche schwierige negative oder positive Beispiele mittels der gelernten Merkmale generieren, was eine verbesserte Unterscheidbarkeit gegenüber anderen Identitäten ermöglicht. Umfangreiche experimentelle Ergebnisse auf großen Benchmark-Datensätzen bestätigen, dass das vorgeschlagene Modell effektiver ist als bisherige state-of-the-art-Modelle.