Person Transfer GAN zur Überbrückung des Domänenabstands für die Person Re-Identifikation

Obwohl die Leistungsfähigkeit der Personen-Wiedererkennung (Person Re-Identification, ReID) erheblich verbessert wurde, wurden viele herausfordernde Probleme in realen Szenarien noch nicht vollständig untersucht, wie zum Beispiel komplexe Szenen und Beleuchtungsveränderungen, Veränderungen von Blickwinkel und Pose sowie die große Anzahl von Identitäten in einem Kamerasystem. Um die Forschung zur Bewältigung dieser Probleme zu fördern, präsentiert dieser Artikel einen neuen Datensatz namens MSMT17 mit vielen wichtigen Eigenschaften: 1) Die Rohvideos wurden durch ein 15-Kamera-Netzwerk aufgenommen, das sowohl in Innen- als auch in Außenszenarien installiert ist; 2) Die Videos umfassen einen langen Zeitraum und zeigen komplexe Beleuchtungsveränderungen; 3) Er enthält aktuell die größte Anzahl von annotierten Identitäten, nämlich 4.101 Identitäten und 126.441 Begrenzungsrahmen. Wir beobachten zudem, dass zwischen Datensätzen häufig ein Domänenunterschied besteht, der im Wesentlichen zu einer starken Leistungsabnahme führt, wenn auf verschiedenen Datensätzen trainiert und getestet wird. Dies hat zur Folge, dass vorhandene Trainingsdaten nicht effektiv für neue Testdomänen genutzt werden können. Um die hohen Kosten für die Annotation neuer Trainingsbeispiele zu reduzieren, schlagen wir ein Personentransfer-Generatives adversariales Netzwerk (PTGAN) vor, um den Domänenunterschied zu überbrücken. Ausführliche Experimente zeigen, dass der Domänenunterschied durch das PTGAN erheblich verringert werden kann.