Ein hochgenauer, überwachungsfreier Ansatz zur Personenwiedererkennung unter Verwendung von Hilfsinformationen, die aus Datensätzen abgeleitet wurden

Überwachte Methoden zur Person-Identifikation (re-ID) beruhen stark auf hochwertigen, zwischen Kameras hinweg annotierten Trainingslabels. Dies erschwert erheblich die Anwendung von re-ID-Modellen in realen Szenarien. Unüberwachte re-ID-Methoden können die Kosten für die Datenauszeichnung reduzieren, ihre Leistung liegt jedoch weiterhin deutlich hinter jener überwachter Ansätze zurück. In dieser Arbeit nutzen wir gezielt ergänzende Informationen, die aus den Datensätzen extrahiert wurden, für eine multimodale Merkmalslernung, einschließlich Kamerainformationen, zeitlicher Informationen und räumlicher Informationen. Durch die Analyse des Stilbias von Kameras, der Merkmale von Fußgängerbewegungstrajektorien sowie der räumlichen Anordnung des Kamernetzwerks werden drei Module vorgeschlagen: das Time-Overlapping Constraint (TOC), die Spatio-Temporal Similarity (STS) und die Same-Camera Penalty (SCP), um diese ergänzenden Informationen effektiv auszunutzen. Die ergänzenden Informationen verbessern die Modellleistung und die Genauigkeit der Inferenz, indem sie Assoziationsbeschränkungen schaffen oder mit visuellen Merkmalen fusioniert werden. Zusätzlich werden drei effektive Trainingsstrategien vorgestellt: die Restricted Label Smoothing Cross Entropy Loss (RLSCE), die Weight Adaptive Triplet Loss (WATL) und die Dynamic Training Iterations (DTI). Diese Strategien erreichen mAP-Werte von 72,4 % und 81,1 % auf den Datensätzen MARS und DukeMTMC-VideoReID, jeweils. In Kombination mit den Modulen zur Ausnutzung ergänzender Informationen erzielt unsere Methode eine mAP von 89,9 % auf DukeMTMC, wobei TOC, STS und SCP jeweils erhebliche Verbesserungen der Leistung beitragen. Die von dieser Arbeit vorgeschlagene Methode übertrifft die meisten bestehenden unüberwachten re-ID-Methoden und verringert die Leistungslücke zwischen unüberwachten und überwachten re-ID-Ansätzen signifikant. Der Quellcode ist unter https://github.com/tenghehan/AuxUSLReID verfügbar.