Une conception simple basée sur le pooling pour la détection en temps réel d'objets saillants

Nous résolvons le problème de détection d'objets saillants en étudiant comment élargir le rôle du pooling dans les réseaux neuronaux convolutifs. Sur la base de l'architecture en forme de U, nous construisons d'abord un module de guidage global (GGM) sur le chemin ascendant, visant à fournir aux couches de différents niveaux d'extraction des informations sur la localisation des objets potentiellement saillants. Nous concevons ensuite un module d'agrégation de caractéristiques (FAM) pour permettre une fusion efficace des informations sémantiques de niveau grossier avec les caractéristiques de niveau fin issues du chemin descendant. En ajoutant des FAM après les opérations de fusion dans le chemin descendant, les caractéristiques de niveau grossier provenant du GGM peuvent être intégrées sans heurts avec les caractéristiques à différentes échelles. Ces deux modules basés sur le pooling permettent une amélioration progressive des caractéristiques sémantiques de haut niveau, produisant ainsi des cartes de saillance enrichies en détails. Les résultats expérimentaux montrent que notre approche proposée peut localiser plus précisément les objets saillants avec des détails affinés, ce qui améliore considérablement les performances par rapport aux méthodes précédentes d'état de l'art. Notre méthode est également rapide et peut fonctionner à une vitesse supérieure à 30 images par seconde lors du traitement d'une image de taille $300 \times 400$. Le code source est disponible à l'adresse http://mmcheng.net/poolnet/.