Leichtgewichtiges mehrästiges Netzwerk für die Personenwiedererkennung

Person Re-Identification zielt darauf ab, Personenidentitäten aus Bildern zu extrahieren, die von mehreren Kameras oder derselben Kamera zu unterschiedlichen Zeitpunkten und Orten aufgenommen wurden. Aufgrund ihrer Bedeutung für zahlreiche Anwendungen im Bereich der Computer Vision – von der Überwachung bis hin zur Mensch-Maschine-Interaktion – müssen Methoden zur Person Re-Identification zuverlässig und schnell sein. Während immer mehr tiefe Architekturen vorgeschlagen werden, um die Leistung zu steigern, nimmt dabei auch die Gesamtmodellkomplexität stetig zu. In diesem Artikel wird ein leichtgewichtiges Netzwerk vorgestellt, das globale, teilbasierte und kanalbasierte Merkmale in einer einheitlichen mehrästigen Architektur kombiniert, die auf dem ressourcensparenden OSNet-Grundgerüst aufbaut. Durch eine gut begründete Kombination von Trainingsmethoden und Architektur-Entscheidungen erreicht unser endgültiges Modell state-of-the-art Ergebnisse auf den Datensätzen CUHK03 labeled, CUHK03 detected und Market-1501 mit jeweils 85,1 % mAP / 87,2 % Rank-1, 82,4 % mAP / 84,9 % Rank-1 und 91,5 % mAP / 96,3 % Rank-1.