Command Palette
Search for a command to run...
Réseau en Cascade Bidirectionnel pour la Détection de Contours Perceptuels
Réseau en Cascade Bidirectionnel pour la Détection de Contours Perceptuels
Jianzhong He Shiliang Zhang Ming Yang Yanhu Shan Tiejun Huang
Résumé
L'exploitation de représentations multi-échelles est cruciale pour améliorer la détection des contours d'objets à différentes échelles. Pour extraire les contours à des échelles considérablement différentes, nous proposons une structure de réseau en cascade bi-directionnelle (Bi-Directional Cascade Network, BDCN), où chaque couche est supervisée par des contours étiquetés à son échelle spécifique, plutôt que d'appliquer directement la même supervision à toutes les sorties du CNN. De plus, afin d'enrichir les représentations multi-échelles apprises par le BDCN, nous introduisons un module d'amélioration d'échelle (Scale Enhancement Module, SEM) qui utilise des convolutions dilatées pour générer des caractéristiques multi-échelles, au lieu d'utiliser des CNN plus profonds ou de fusionner explicitement des cartes de contours multi-échelles. Ces nouvelles approches encouragent l'apprentissage de représentations multi-échelles dans différentes couches et détectent des contours bien définis par leurs échelles respectives. L'apprentissage de couches dédiées à chaque échelle permet également d'obtenir un réseau compact avec une fraction du nombre de paramètres. Nous évaluons notre méthode sur trois jeux de données, à savoir BSDS500, NYUDv2 et Multicue, et obtenons une mesure F ODS de 0,828, soit 1,3 % supérieure à l'état actuel de l'art sur BSDS500. Le code est disponible sur https://github.com/pkuCactus/BDCN.