Kamerastil-Anpassung für die Person-Wiedererkennung

Als eine Aufgabe der Cross-Camera-Retrieval stellt die Person-Re-Identifikation vor das Problem von Bildstilvariationen, die durch verschiedene Kameras verursacht werden. Die Forschung befasst sich implizit mit diesem Problem, indem sie einen kamerainvarianten Deskriptor-Unterraum lernt. In dieser Arbeit betrachten wir diese Herausforderung explizit, indem wir die Kamerastil-Adaption (CamStyle) einführen. CamStyle kann als ein Datenverstärkungsansatz dienen, der die Unterschiede im Kamerastil glättet. Speziell können mit CycleGAN etikettierte Trainingsbilder in den Stil jeder Kamera übertragen werden und zusammen mit den ursprünglichen Trainingsbeispielen einen erweiterten Trainingsdatensatz bilden. Diese Methode erhöht zwar die Datenvielfalt und reduziert das Überanpassen, führt aber auch zu einem erheblichen Maß an Rauschen. Um den Einfluss des Rauschens zu mildern, wird die Label-Smooth-Regularisierung (LSR) angewendet. Die unveränderte Version unserer Methode (ohne LSR) erzielt in Systemen mit wenigen Kameras, in denen Überanpassungen häufig auftreten, zufriedenstellende Ergebnisse. Mit LSR zeigen wir konstante Verbesserungen in allen Systemen, unabhängig vom Ausmaß des Überanpassens. Wir berichten auch von wettbewerbsfähiger Genauigkeit im Vergleich zum aktuellen Stand der Technik.