HyperAIHyperAI
vor 16 Tagen

Asymmetrisches Co-Teaching für die unsupervisierte cross-domain Personenwiedererkennung

Fengxiang Yang, Ke Li, Zhun Zhong, Zhiming Luo, Xing Sun, Hao Cheng, Xiaowei Guo, Feiyue Huang, Rongrong Ji, Shaozi Li
Asymmetrisches Co-Teaching für die unsupervisierte cross-domain Personenwiedererkennung
Abstract

Person-Identifikation (Re-ID) stellt aufgrund der hohen Variabilität innerhalb von Identitätsproben und unterschiedlicher Aufnahmeebedingungen eine herausfordernde Aufgabe dar. Obwohl jüngste Fortschritte in der tiefen Lernverfahren beachtliche Genauigkeit in standardisierten Szenen – also im Quellbereich – erzielt haben, gelingt es nur wenigen Ansätzen, gut auf unbekannte Zielbereiche zu generalisieren. Eine gängige Lösung besteht darin, unlabeled Zielbilder durch Clustering mit Pseudolabels zu versehen und anschließend das Modell neu zu trainieren. Allerdings neigen Clustering-Methoden dazu, verrauschte Labels zu generieren und Proben mit geringer Konfidenz als Ausreißer zu eliminieren, was den Neutrainingsprozess beeinträchtigen und somit die Generalisierungsfähigkeit einschränken kann. In dieser Studie argumentieren wir, dass die ausgebauten Beispiele durch die explizite Einführung eines Sample-Filterungsprozesses nach dem Clustering erheblich effizienter genutzt werden können. Dazu entwerfen wir einen asymmetrischen Co-Teaching-Framework, der durch die Zusammenarbeit zweier Modelle verrauschte Labels widersteht, indem jedes Modell Daten mit vermutlich sauberen Labels für das andere Modell auswählt. Gleichzeitig erhält ein Modell möglichst reine Proben, während das andere möglichst vielfältige Proben verarbeitet. Dieser Prozess fördert die Auswahl von Trainingsproben, die sowohl sauber als auch vielfältig sind, und ermöglicht eine gegenseitige Verbesserung der beiden Modelle über mehrere Iterationen hinweg. Ausführliche Experimente zeigen, dass der vorgeschlagene Rahmen die meisten auf Clustering basierenden Methoden konsistent verbessert und die beste Adaptationsgenauigkeit der State-of-the-Art-Methoden steigert. Unser Code ist unter https://github.com/FlyingRoastDuck/ACT_AAAI20 verfügbar.

Asymmetrisches Co-Teaching für die unsupervisierte cross-domain Personenwiedererkennung | Neueste Forschungsarbeiten | HyperAI