Neuüberlegung der Verteilungslücke bei der Person-Reidentifizierung durch kamerabasierte Batch-Normalisierung

Die grundlegende Schwierigkeit bei der Personen-Wiedererkennung (Person Re-Identification, ReID) besteht darin, die Korrespondenz zwischen einzelnen Kameras zu lernen. Dies erfordert kostspielige Annotationen zwischen den Kameras, jedoch kann nicht garantiert werden, dass die trainierten Modelle sich gut auf bisher unbekannte Kameras übertragen. Diese Probleme begrenzen die Anwendung von ReID erheblich. In dieser Arbeit wird das Arbeitsprinzip herkömmlicher ReID-Ansätze neu überdacht und eine neue Lösung vorgeschlagen. Mit einem effektiven Operator namens Camera-based Batch Normalization (CBN) zwingen wir die Bild-Daten aller Kameras in denselben Teilraum, sodass der Verteilungsunterschied zwischen beliebigen Kamerapären stark reduziert wird. Diese Ausrichtung bringt zwei Vorteile mit sich. Erstens profitiert das trainierte Modell von besseren Generalisierungsfähigkeiten sowohl in Szenarien mit unbekannten Kameras als auch bei der Übertragung auf mehrere Trainingsdatensätze. Zweitens können wir uns auf innerkamerabasierte Annotationen verlassen, die bisher aufgrund des Mangels an überkamerabasierter Information unterschätzt wurden, um wettbewerbsfähige ReID-Leistungen zu erzielen. Experimente zu einer Vielzahl von ReID-Aufgaben belegen die Effektivität unseres Ansatzes. Der Code ist unter https://github.com/automan000/Camera-based-Person-ReID verfügbar.