HyperAIHyperAI
vor 17 Tagen

Aufmerksamkeitsgesteuertes Context-Feature-Pyramiden-Netzwerk für die Objekterkennung

Junxu Cao, Qi Chen, Jun Guo, Ruichao Shi
Aufmerksamkeitsgesteuertes Context-Feature-Pyramiden-Netzwerk für die Objekterkennung
Abstract

Bei der Objektdetektion bleibt die widersprüchliche Anforderung zwischen der Auflösung des Feature-Maps und dem Empfindlichkeitsfeld (receptive field) bei hochauflösenden Eingaben weiterhin eine offene Frage. Um dieses Problem anzugehen, entwickeln wir in diesem Artikel eine neue Architektur namens Attention-guided Context Feature Pyramid Network (AC-FPN), die diskriminative Informationen aus verschiedenen großen Empfindlichkeitsfeldern durch die Integration von auf Aufmerksamkeit gestützten Mehrpfad-Features nutzt. Das Modell besteht aus zwei Modulen. Das erste ist das Context Extraction Module (CEM), das große kontextuelle Informationen aus mehreren Empfindlichkeitsfeldern extrahiert. Da redundanten kontextuellen Beziehungen die Lokalisierung und Erkennung verfälschen können, entwerfen wir zudem das zweite Modul, das Attention-guided Module (AM), welches mithilfe des Aufmerksamkeitsmechanismus adaptiv die auffälligen Abhängigkeiten über Objekten erfassen kann. Das AM setzt sich aus zwei Untermodulen zusammen: dem Context Attention Module (CxAM), das sich auf die Erfassung diskriminativer Semantik konzentriert, und dem Content Attention Module (CnAM), das sich auf die präzise Positionierung fokussiert. Besonders hervorzuheben ist, dass unsere AC-FPN problemlos in bestehende FPN-basierte Modelle integriert werden kann. Umfangreiche Experimente zur Objektdetektion und Instanzsegmentierung zeigen, dass bestehende Modelle mit unserem vorgeschlagenen CEM und AM ihre Kontrastmodelle erheblich übertrumpfen, und dass unser Modell zudem state-of-the-art Ergebnisse erzielt. Den Quellcode stellen wir unter https://github.com/Caojunxu/AC-FPN zur Verfügung.