FD-GAN: Pose-gesteuerte Feature-Distilling-GAN für robuste Person-Reidentifizierung

Die Personen-Wiedererkennung (reID) ist eine wichtige Aufgabe, die das Finden von Bildern einer bestimmten Person in einem Bild-Datensatz auf der Grundlage eines einzigen Bildes dieser Person erfordert. Bei der Lernphase robuste Merkmale von Personen zu extrahieren, stellt die Pose-Variation der Personenbilder eine der größten Herausforderungen dar. Bestehende Ansätze zur Lösung dieses Problems führen entweder eine Ausrichtung der Personen durch oder lernen regionenbasierte Darstellungen des menschlichen Körpers. Für die Inferenz werden in der Regel zusätzliche Poseninformationen und ein höherer Rechenaufwand benötigt. Um dieses Problem zu lösen, wird ein Feature-Distilling-Generative-Adversarial-Network (FD-GAN) vorgeschlagen, das identitätsbezogene und poseunabhängige Darstellungen lernt. Es handelt sich dabei um einen neuartigen Rahmen basierend auf einer Siamesischen Struktur mit mehreren innovativen Diskriminatoren für menschliche Posen und Identitäten. Neben den Diskriminatoren wird auch ein neuer gleiche-Pose-Verlust integriert, der verlangt, dass die generierten Bilder derselben Person in ihrer Erscheinung ähnlich sind. Nach dem Lernen von poseunabhängigen Personenmerkmalen unter Anleitung durch die Pose sind während des Testens weder zusätzliche Poseninformationen noch zusätzlicher Rechenaufwand erforderlich. Das von uns vorgeschlagene FD-GAN erreicht den aktuellen Stand der Technik auf drei Personen-Wiedererkennungsdatensätzen, was die Effektivität und die Fähigkeit zur robusten Merkmalsextraktion des FD-GANs unterstreicht.