HyperAIHyperAI

Command Palette

Search for a command to run...

Wechselseitiges Mean-Teaching: Pseudo-Label-Raffinerie für unsupervised Domain Adaptation bei der Personenwiedererkennung

Yixiao Ge Dapeng Chen Hongsheng Li

Zusammenfassung

Personen-Identifikation im Überwachungsbereich (Person Re-Identification, Re-ID) zielt darauf ab, dieselben Personen in Bildern verschiedener Kameras zu identifizieren. Allerdings stellen die zwischen verschiedenen Datensätzen bestehenden Domänenunterschiede eine erhebliche Herausforderung dar, wenn ein auf einem Datensatz trainiertes Re-ID-Modell auf einen anderen Datensatz übertragen werden soll. Moderne Methoden zur unsupervisierten Domänenanpassung für Person Re-ID übertragen das aus der Quell-Domäne gelernte Wissen, indem sie mit durch Clustering-Algorithmen auf der Ziel-Domäne generierten Pseudolabels optimieren. Obwohl diese Ansätze hervorragende Ergebnisse erzielen, wird der unvermeidliche Label-Rausch, der durch den Clustering-Prozess entsteht, oft ignoriert. Solche verrauschten Pseudolabels beeinträchtigen erheblich die Fähigkeit des Modells, die Merkmalsdarstellungen auf der Ziel-Domäne weiter zu verbessern. Um die negativen Auswirkungen verrauschter Pseudolabels zu verringern, schlagen wir vor, die Pseudolabels in der Ziel-Domäne weich zu verfeinern, indem wir einen unsupervisierten Rahmenwerk, das Mutual Mean-Teaching (MMT)-Verfahren, vorschlagen, um durch eine abwechselnde Trainingsstrategie bessere Merkmale aus der Ziel-Domäne zu lernen – sowohl anhand vorab verfeinerter, harter Pseudolabels als auch in Echtzeit verfeinerter weicher Pseudolabels. Zudem wird üblicherweise sowohl die Klassifikationsverlustfunktion als auch der Triplet-Verlust gemeinsam verwendet, um optimale Leistungen bei Person-Re-ID-Modellen zu erzielen. Allerdings ist der herkömmliche Triplet-Verlust nicht mit weich verfeinerten Labeln kompatibel. Um dieses Problem zu lösen, wird eine neuartige Soft-Softmax-Triplet-Verlustfunktion vorgeschlagen, die das Lernen mit weichen Pseudotriplet-Labeln ermöglicht und somit die optimale Leistung bei der Domänenanpassung erreicht. Das vorgeschlagene MMT-Framework erreicht erhebliche Verbesserungen von 14,4 %, 18,2 %, 13,1 % und 16,4 % im mAP-Wert bei den unsupervisierten Domänenanpassungsaufgaben Market-to-Duke, Duke-to-Market, Market-to-MSMT und Duke-to-MSMT. Der Quellcode ist unter https://github.com/yxgeee/MMT verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp