Command Palette
Search for a command to run...
Deformable Part Descriptor für die feinkörnige Erkennung und Attributvorhersage
Deformable Part Descriptor für die feinkörnige Erkennung und Attributvorhersage
Trevor Darrell Forrest Iandola Ryan Farrell Ning Zhang
Zusammenfassung
Die Erkennung von Objekten in feinkörnigen Domänen kann aufgrund der subtilen Unterschiede zwischen Unterarten äußerst herausfordernd sein. Diskriminative Merkmale sind oft stark lokalisiert, wodurch herkömmliche Ansätze zur Objekterkennung Schwierigkeiten mit der häufig auftretenden großen Pose-Variation in diesen Domänen haben. Die Pose-Normalisierung zielt darauf ab, Trainingsbeispiele entweder stückweise nach Teilen oder global für das gesamte Objekt auszurichten, wodurch Unterschiede in Pose und Blickwinkel effektiv eliminiert werden. Frühere Ansätze basierten auf rechenintensiven Filter-Ensembles zur Teillokalisierung und erforderten umfangreiche Überwachung. In diesem Paper werden zwei pose-normalisierte Deskriptoren vorgestellt, die auf recheneffizienten deformierbaren Teilmodellen basieren. Der erste nutzt die Semantik, die in stark überwachten DPM-Teilen inhärent ist. Der zweite nutzt schwache semantische Annotationen, um Korrespondenzen zwischen Komponenten zu lernen und pose-normalisierte Deskriptoren aus den latenten Teilen eines schwach überwachten DPM zu berechnen. Diese Darstellungen ermöglichen eine Pooling-Operation über verschiedene Poses und Blickwinkel hinweg, was wiederum Aufgaben wie die feinkörnige Erkennung und die Attributvorhersage erleichtert. Experimente auf dem Caltech-UCSD Birds 200-Datensatz und dem Berkeley Human Attribute-Datensatz zeigen signifikante Verbesserungen gegenüber aktuellen State-of-the-Art-Algorithmen.