Command Palette
Search for a command to run...
RefineNet : réseaux de raffinement à chemins multiples pour la segmentation sémantique haute résolution
RefineNet : réseaux de raffinement à chemins multiples pour la segmentation sémantique haute résolution
Lin Guosheng Milan Anton Shen Chunhua Reid Ian
Résumé
Récemment, les réseaux de neurones convolutifs (CNN) très profonds ont fait preuve d’une performance exceptionnelle dans la reconnaissance d’objets, tout en devenant le choix privilégié pour les problèmes de classification dense tels que la segmentation sémantique. Toutefois, les opérations de sous-échantillonnage répétées, comme le pooling ou le décalage de convolution, présentes dans les CNN profonds, entraînent une baisse importante de la résolution initiale de l’image. Dans cette étude, nous proposons RefineNet, un réseau généraliste à chemins multiples permettant d’exploiter explicitement toute l’information disponible tout au long du processus de sous-échantillonnage, afin de réaliser des prédictions à haute résolution grâce à des connexions résiduelles à longue portée. Ainsi, les couches plus profondes, qui captent des caractéristiques sémantiques de haut niveau, peuvent être directement affinées à l’aide de caractéristiques à forte résolution provenant des convolutions antérieures. Les composants individuels de RefineNet reposent sur des connexions résiduelles suivant le principe de l’application identité, ce qui permet un entraînement efficace en boucle complète (end-to-end). Par ailleurs, nous introduisons le pooling résiduel en chaîne, une méthode qui capture de manière efficace un contexte arrière-plan riche. Nous menons des expériences approfondies et établissons de nouveaux records sur sept jeux de données publics. En particulier, nous obtenons un score d’intersection sur union (IoU) de 83,4 sur le défi PASCAL VOC 2012, résultat le meilleur jamais rapporté à ce jour.