HyperAIHyperAI
il y a 4 mois

Les grands noyaux comptent -- Améliorer la segmentation sémantique par un réseau de convolution globale

Chao Peng; Xiangyu Zhang; Gang Yu; Guiming Luo; Jian Sun
Les grands noyaux comptent -- Améliorer la segmentation sémantique par un réseau de convolution globale
Résumé

L'une des tendances récentes [30, 31, 14] dans la conception des architectures de réseau est l'empilement de filtres petits (par exemple, 1x1 ou 3x3) sur l'ensemble du réseau, car les filtres petits empilés sont plus efficaces qu'un noyau large, étant donné une complexité computationnelle équivalente. Cependant, dans le domaine de la segmentation sémantique, où il est nécessaire d'effectuer une prédiction dense par pixel, nous constatons que le noyau large (et le champ récepteur effectif) joue un rôle important lorsque nous devons réaliser simultanément les tâches de classification et de localisation. En suivant notre principe de conception, nous proposons un Réseau de Convolution Global pour aborder à la fois les problèmes de classification et de localisation dans la segmentation sémantique. Nous suggérons également une amélioration des contours basée sur les résidus pour affiner davantage les contours des objets. Notre approche atteint des performances d'état de l'art sur deux jeux de données publics et dépasse considérablement les résultats précédents : 82,2 % (contre 80,2 %) sur le jeu de données PASCAL VOC 2012 et 76,9 % (contre 71,8 %) sur le jeu de données Cityscapes.