Fonctionnalités profondes non locales pour la détection d'objets saillants

La détection de saillance vise à mettre en évidence les objets les plus pertinents dans une image. Les méthodes basées sur des modèles classiques peinent à détecter efficacement les objets saillants lorsqu’ils sont placés devant un arrière-plan encombré, tandis que les réseaux neuronaux profonds souffrent quant à eux d’une complexité excessive et de vitesses d’évaluation lentes. Dans cet article, nous proposons un réseau de neurones convolutif simplifié qui combine informations locales et globales à l’aide d’une structure en grille multi-résolution 4×5. Contrairement aux approches habituelles qui imposent une cohérence spatiale via un CRF (Conditional Random Field) ou des superpixels, nous avons mis en œuvre une fonction de perte inspirée du fonctionnel de Mumford-Shah, qui pénalise particulièrement les erreurs sur les frontières des objets. Nous avons entraîné notre modèle sur le jeu de données MSRA-B et évalué ses performances sur six jeux de données de référence pour la détection de saillance. Les résultats montrent que notre méthode atteint un niveau de performance équivalent aux états de l’art, tout en réduisant le temps de calcul d’un facteur compris entre 18 et 100, permettant ainsi une détection de saillance quasi en temps réel avec une haute performance.