HyperAIHyperAI
il y a 17 jours

Réseau pyramid de caractéristiques contextuelles guidé par l'attention pour la détection d'objets

Junxu Cao, Qi Chen, Jun Guo, Ruichao Shi
Réseau pyramid de caractéristiques contextuelles guidé par l'attention pour la détection d'objets
Résumé

Pour la détection d'objets, la question de la gestion du conflit entre la résolution de la carte de caractéristiques et le champ réceptif sur des entrées à haute résolution reste encore ouverte. Dans ce papier, afin de traiter ce problème, nous proposons une nouvelle architecture, nommée Attention-guided Context Feature Pyramid Network (AC-FPN), qui exploite des informations discriminatives provenant de différents champs réceptifs larges en intégrant des caractéristiques multi-chemins guidées par l’attention. Le modèle comprend deux modules. Le premier est le Context Extraction Module (CEM), qui permet d’extraire des informations contextuelles étendues à partir de plusieurs champs réceptifs. Étant donné que des relations contextuelles redondantes peuvent induire en erreur lors de la localisation et de la reconnaissance, nous avons également conçu un second module appelé Attention-guided Module (AM), qui capte de manière adaptative les dépendances saillantes autour des objets grâce à un mécanisme d’attention. L’AM se compose de deux sous-modules : le Context Attention Module (CxAM), qui se concentre sur l’extraction de sémantiques discriminatives, et le Content Attention Module (CnAM), qui vise à localiser précisément les objets. Plus important encore, notre AC-FPN peut être facilement intégrée dans les modèles existants basés sur FPN. Des expériences étendues sur la détection d'objets et la segmentation d'instances montrent que les modèles existants enrichis par notre CEM et AM surpassent significativement leurs versions sans ces modules, et que notre modèle atteint des résultats de pointe. Le code source est disponible à l’adresse suivante : https://github.com/Caojunxu/AC-FPN.