HyperAIHyperAI
il y a 13 jours

Réseaux de différences de pixels pour une détection efficace des contours

Zhuo Su, Wenzhe Liu, Zitong Yu, Dewen Hu, Qing Liao, Qi Tian, Matti Pietikäinen, Li Liu
Réseaux de différences de pixels pour une détection efficace des contours
Résumé

Récemment, les réseaux neuronaux profonds à convolution (CNN) ont pu atteindre des performances au niveau humain dans la détection de contours grâce à leur capacité à représenter de manière riche et abstraite les contours. Toutefois, cette haute performance est obtenue au prix d’un grand réseau CNN pré-entraîné, ce qui entraîne une forte consommation de mémoire et d’énergie. En outre, il est surprenant que les connaissances traditionnelles issues des détecteurs de contours classiques — tels que Canny, Sobel ou LBP — soient peu explorées dans le contexte actuel de développement rapide du deep learning. Pour remédier à ces limites, nous proposons une architecture simple, légère mais efficace, nommée Pixel Difference Network (PiDiNet), destinée à une détection de contours performante et économe en ressources. Des expérimentations étendues sur les jeux de données BSDS500, NYUD et Multicue démontrent l’efficacité de notre méthode ainsi que son haut rendement en apprentissage et en inférence. De manière surprenante, en entraînant PiDiNet à partir de zéro uniquement sur les jeux de données BSDS500 et VOC, nous obtenons une performance supérieure à celle perçue humainement (0,807 contre 0,803 en mesure F-ODS) sur BSDS500, avec une cadence de 100 FPS et moins d’1 million de paramètres. Une version accélérée de PiDiNet, avec moins de 0,1 million de paramètres, parvient toutefois à atteindre des performances comparables aux meilleures méthodes actuelles, à raison de 200 FPS. Les résultats obtenus sur les jeux de données NYUD et Multicue confirment des observations similaires. Le code source est disponible à l’adresse suivante : https://github.com/zhuoinoulu/pidinet.