Unlabeled Samples Generated by GAN verbessern die Person-Reidentifikations-Baseline in vitro

Der Hauptbeitrag dieser Arbeit besteht in einem einfachen semi-überwachten Pipeline, das ausschließlich den ursprünglichen Trainingsdatensatz verwendet, ohne zusätzliche Daten zu sammeln. Die Herausforderungen liegen darin, 1) wie man mehr Trainingsdaten nur aus dem Trainingsdatensatz erhält und 2) wie man die neu erzeugten Daten nutzt. In dieser Studie wird ein generativer adversarischer Netzwerk (GAN) verwendet, um nicht gekennzeichnete Stichproben zu erzeugen. Wir schlagen eine Label-Smoothing-Regularisierung für Ausreißer (LSRO) vor. Diese Methode weist den nicht gekennzeichneten Bildern eine gleichmäßige Kennzeichnungsverteilung zu, was das überwachte Modell reguliert und die Baseline verbessert. Wir verifizieren die vorgeschlagene Methode an einem praktischen Problem: der Person-Re-Identifikation (Re-ID). Diese Aufgabe zielt darauf ab, eine abgefragte Person von anderen Kameras wiederzufinden. Für die Stichprobenerzeugung verwenden wir ein tiefes konvolutorisches generatives adversariales Netzwerk (DCGAN), und für das Lernen von Repräsentationen ein Baseline-Konvolutionsneuronales Netzwerk (CNN). Experimente zeigen, dass das Hinzufügen von GAN-erzeugten Daten die diskriminierende Fähigkeit der gelernten CNN-Einbettungen effektiv verbessert. Auf drei großen Datensätzen, Market-1501, CUHK03 und DukeMTMC-reID, erreichen wir jeweils Verbesserungen von +4,37%, +1,6% und +2,46% im Rang-1-Präzisionsmaß gegenüber dem Baseline-CNN. Zusätzlich wenden wir die vorgeschlagene Methode auf die feingranulare Vogelerkennung an und erreichen eine Verbesserung von +0,6% gegenüber einer starken Baseline. Der Code ist unter https://github.com/layumi/Person-reID_GAN verfügbar.