HyperAIHyperAI
vor 2 Monaten

Verbesserung der Fußgängerattributerkennung durch schwach überwachte, mehrskalige attributspezifische Lokalisierung

Chufeng Tang; Lu Sheng; Zhaoxiang Zhang; Xiaolin Hu
Verbesserung der Fußgängerattributerkennung durch schwach überwachte, mehrskalige attributspezifische Lokalisierung
Abstract

Die Erkennung von Fußgängereigenschaften ist ein aufstrebendes Forschungsthema im Bereich der Videüberwachung. Um die Existenz einer bestimmten Eigenschaft vorherzusagen, ist es erforderlich, die Bereiche zu lokalisieren, die mit dieser Eigenschaft in Verbindung stehen. Allerdings sind in dieser Aufgabe keine Regionenannotationen verfügbar. Wie diese attributbezogenen Bereiche herausgearbeitet werden können, stellt weiterhin eine Herausforderung dar. Bestehende Methoden haben visuelle Aufmerksamkeit ohne Berücksichtigung von Eigenschaften oder heuristische Mechanismen zur Lokalisierung von Körperteilen angewendet, um lokale Merkmalsrepräsentationen zu verbessern, während sie die Nutzung von Eigenschaften zur Definition lokaler Merkmalsbereiche vernachlässigt haben. Wir schlagen ein flexibles Attribut-Lokalisierungsmodul (ALM) vor, das sich anpasst und die diskriminativsten Bereiche für jede Eigenschaft auf mehreren Ebenen entdeckt und deren regionale Merkmale lernt. Darüber hinaus wird auch eine Merkmalspyramidenarchitektur eingeführt, um durch hochwertige semantische Leitlinien die attributspezifische Lokalisierung auf niedrigeren Ebenen zu verbessern. Das vorgeschlagene Framework erfordert keine zusätzlichen Regionenannotationen und kann mit mehrstufiger tiefgehender Überwachung end-to-end trainiert werden. Ausführliche Experimente zeigen, dass die vorgeschlagene Methode den aktuellen Stand der Technik auf drei Fußgängerattributdatensätzen erreicht, einschließlich PETA, RAP und PA-100K.