HyperAIHyperAI
il y a 2 mois

RefineNet : Réseaux de raffinement multi-chemin pour la segmentation sémantique à haute résolution

Lin, Guosheng ; Milan, Anton ; Shen, Chunhua ; Reid, Ian
RefineNet : Réseaux de raffinement multi-chemin pour la segmentation sémantique à haute résolution
Résumé

Récemment, les réseaux neuronaux convolutifs (CNNs) très profonds ont montré des performances exceptionnelles en reconnaissance d'objets et sont également devenus le choix privilégié pour les problèmes de classification dense, tels que la segmentation sémantique. Cependant, les opérations de sous-échantillonnage répétées comme le pooling ou le stride de convolution dans les CNNs profonds entraînent une diminution significative de la résolution initiale des images.Dans cet article, nous présentons RefineNet, un réseau de raffinement multi-chemin générique qui exploite explicitement toutes les informations disponibles tout au long du processus de sous-échantillonnage afin de permettre des prédictions à haute résolution grâce à des connexions résiduelles à longue portée. De cette manière, les couches plus profondes qui captent des caractéristiques sémantiques de haut niveau peuvent être directement affinées en utilisant des caractéristiques détaillées provenant des premières convolutions. Les composants individuels de RefineNet utilisent des connexions résiduelles suivant l'idée d'une cartographie identitaire, ce qui permet un entraînement efficace de bout en bout. De plus, nous introduisons le pooling résiduel enchaîné, qui capture un contexte arrière-plan riche de manière efficace.Nous menons des expériences exhaustives et établissons de nouveaux résultats d'état de l'art sur sept jeux de données publics. En particulier, nous obtenons un score d'intersection-sur-réunion (IoU) de 83,4 sur le jeu de données PASCAL VOC 2012 difficile, ce qui constitue le meilleur résultat rapporté à ce jour.