Command Palette
Search for a command to run...
PANDA: Pose-alignierte Netze für die tiefe Attributmodellierung
PANDA: Pose-alignierte Netze für die tiefe Attributmodellierung
Zhang Ning Paluri Manohar Ranzato Marc'Aurelio Darrell Trevor Bourdev Lubomir
Zusammenfassung
Wir stellen eine Methode zur Schätzung menschlicher Attribute (z. B. Geschlecht, Haarstil, Kleidungsstil, Ausdruck, Handlung) aus Bildern von Personen unter stark variierenden Perspektiven, Körperhaltungen, Erscheinungsbildern, Gelenkbewegungen und Verdeckungen vor. Convolutional Neural Networks (CNN) haben sich bei der Erkennung großer Objektklassen als äußerst leistungsfähig erwiesen. Im Kontext der Attributklassifikation ist das Signal jedoch oft subtil und kann sich auf nur einen kleinen Teil des Bildes beschränken, während das Bild überwiegend durch die Auswirkungen von Pose und Perspektive bestimmt wird. Die Berücksichtigung von Pose-Variationen würde eine Ausbildung auf sehr großen, beschrifteten Datensätzen erfordern, die derzeit nicht verfügbar sind. Teilbasierte Modelle wie Poselets und DPM haben sich für dieses Problem als wirksam erwiesen, sind jedoch durch ihre flachen, niedrigstufigen Merkmale eingeschränkt. Wir schlagen eine neue Methode vor, die teilbasierte Modelle und tiefe Lernverfahren durch die Ausbildung von pose-normalisierten CNNs verbindet. Wir zeigen eine erhebliche Verbesserung gegenüber den derzeit besten Verfahren bei anspruchsvollen Aufgaben der Attributklassifikation in unbeschränkten Umgebungen. Experimente bestätigen, dass unsere Methode sowohl die besten teilbasierten Ansätze für dieses Problem als auch herkömmliche CNNs, die auf dem gesamten Begrenzungsrechteck der Person trainiert wurden, übertrifft.