HyperAIHyperAI
vor 2 Monaten

Pyramid Feature Attention Netzwerk für Salienz-Detektion

Ting Zhao; Xiangqian Wu
Pyramid Feature Attention Netzwerk für Salienz-Detektion
Abstract

Die Salienzdetektion ist eine der grundlegenden Herausforderungen im Bereich der Computer Vision. Die effektive Extraktion von Merkmalen ist ein entscheidender Punkt für die Salienzdetektion. Aktuelle Methoden integrieren in der Regel ununterschiedlich mehrstufige Faltungsmerkmale. Allerdings sind nicht alle Merkmale für die Salienzdetektion nützlich, und einige können sogar Störungen verursachen. Um dieses Problem zu lösen, schlagen wir das Pyramid Feature Attention-Netzwerk vor, um sich auf effektive hochstufige Kontextmerkmale und niedrigstufige räumliche Strukturmerkmale zu konzentrieren. Zunächst entwickeln wir ein Kontextbewusstes Pyramiden-Merkmalsextraktionsmodul (Context-aware Pyramid Feature Extraction, CPFE) für mehrstufige hochstufige Merkmalskarten, um reichhaltige Kontextmerkmale zu erfassen. Anschließend wenden wir nach den CPFE-Merkmalskarten Kanalweise Aufmerksamkeit (Channel-wise Attention, CA) an und nach den niedrigstufigen Merkmalskarten räumliche Aufmerksamkeit (Spatial Attention, SA), bevor wir die Ausgaben von CA und SA zusammenführen. Schließlich schlagen wir einen Kantenerhaltungsverlust vor, um das Netzwerk beim Lernen detaillierterer Informationen in der Randlokalisierung zu leiten. Ausführliche Bewertungen an fünf Benchmark-Datensätzen zeigen, dass die vorgeschlagene Methode unter verschiedenen Evaluationsmetriken den aktuellen Stand der Technik übertrifft.

Pyramid Feature Attention Netzwerk für Salienz-Detektion | Neueste Forschungsarbeiten | HyperAI