Wechselseitiges Mean-Teaching: Pseudo-Label-Raffinerie für unsupervised Domain Adaptation bei der Personenwiedererkennung

Personen-Identifikation im Überwachungsbereich (Person Re-Identification, Re-ID) zielt darauf ab, dieselben Personen in Bildern verschiedener Kameras zu identifizieren. Allerdings stellen die zwischen verschiedenen Datensätzen bestehenden Domänenunterschiede eine erhebliche Herausforderung dar, wenn ein auf einem Datensatz trainiertes Re-ID-Modell auf einen anderen Datensatz übertragen werden soll. Moderne Methoden zur unsupervisierten Domänenanpassung für Person Re-ID übertragen das aus der Quell-Domäne gelernte Wissen, indem sie mit durch Clustering-Algorithmen auf der Ziel-Domäne generierten Pseudolabels optimieren. Obwohl diese Ansätze hervorragende Ergebnisse erzielen, wird der unvermeidliche Label-Rausch, der durch den Clustering-Prozess entsteht, oft ignoriert. Solche verrauschten Pseudolabels beeinträchtigen erheblich die Fähigkeit des Modells, die Merkmalsdarstellungen auf der Ziel-Domäne weiter zu verbessern. Um die negativen Auswirkungen verrauschter Pseudolabels zu verringern, schlagen wir vor, die Pseudolabels in der Ziel-Domäne weich zu verfeinern, indem wir einen unsupervisierten Rahmenwerk, das Mutual Mean-Teaching (MMT)-Verfahren, vorschlagen, um durch eine abwechselnde Trainingsstrategie bessere Merkmale aus der Ziel-Domäne zu lernen – sowohl anhand vorab verfeinerter, harter Pseudolabels als auch in Echtzeit verfeinerter weicher Pseudolabels. Zudem wird üblicherweise sowohl die Klassifikationsverlustfunktion als auch der Triplet-Verlust gemeinsam verwendet, um optimale Leistungen bei Person-Re-ID-Modellen zu erzielen. Allerdings ist der herkömmliche Triplet-Verlust nicht mit weich verfeinerten Labeln kompatibel. Um dieses Problem zu lösen, wird eine neuartige Soft-Softmax-Triplet-Verlustfunktion vorgeschlagen, die das Lernen mit weichen Pseudotriplet-Labeln ermöglicht und somit die optimale Leistung bei der Domänenanpassung erreicht. Das vorgeschlagene MMT-Framework erreicht erhebliche Verbesserungen von 14,4 %, 18,2 %, 13,1 % und 16,4 % im mAP-Wert bei den unsupervisierten Domänenanpassungsaufgaben Market-to-Duke, Duke-to-Market, Market-to-MSMT und Duke-to-MSMT. Der Quellcode ist unter https://github.com/yxgeee/MMT verfügbar.