HyperAIHyperAI
vor 2 Monaten

Menschliche semantische Analyse für die Wiedererkennung von Personen

Mahdi M. Kalayeh; Emrah Basaran; Muhittin Gokmen; Mustafa E. Kamasak; Mubarak Shah
Menschliche semantische Analyse für die Wiedererkennung von Personen
Abstract

Die Person-Re-Identifikation ist eine herausfordernde Aufgabe, hauptsächlich aufgrund von Faktoren wie Hintergrundstörungen, Pose, Beleuchtung und Variationen der Kameraperspektive. Diese Elemente erschweren den Prozess des Extrahierens robuster und diskriminativer Repräsentationen, was es verhindert, dass verschiedene Identitäten erfolgreich voneinander abgegrenzt werden können. Um das Lernen von Repräsentationen zu verbessern, werden in der Regel lokale Merkmale aus Körperteilen von Menschen extrahiert. Allerdings basiert die übliche Praxis für diesen Prozess auf der Detektion von Begrenzungsboxen. In diesem Artikel schlagen wir vor, menschliche semantische Segmentierung (human semantic parsing) zu verwenden, die dank ihrer Pixelgenauigkeit und der Fähigkeit, beliebige Konturen zu modellieren, natürlich eine bessere Alternative darstellt. Unser vorgeschlagener Ansatz SPReID integriert die semantische Segmentierung in die Person-Re-Identifikation und übertrifft nicht nur erheblich seine Baseline-Vergleichsgruppe, sondern erreicht auch den aktuellen Stand der Technik (state-of-the-art). Wir zeigen außerdem, dass durch die Anwendung einer \textit{einfachen}, aber effektiven Trainingsstrategie gängige tiefe Faltungsarchitekturen wie Inception-V3 und ResNet-152 ohne Modifikationen und allein durch die Verarbeitung des gesamten Bildes den aktuellen Stand der Technik deutlich übertreffen können. Unsere vorgeschlagenen Methoden verbessern den Stand der Technik in der Person-Re-Identifikation wie folgt: Bei Market-1501 um ~17\% im mAP und ~6\% im Rank-1; bei CUHK03 um ~4\% im Rank-1; und bei DukeMTMC-reID um ~24\% im mAP und ~10\% im Rank-1.

Menschliche semantische Analyse für die Wiedererkennung von Personen | Neueste Forschungsarbeiten | HyperAI