Apprentissage d'un réseau de caractéristiques discriminatives pour la segmentation sémantique

La plupart des méthodes actuelles de segmentation sémantique souffrent encore de deux défis majeurs : l'incohérence intra-classe et la confusion inter-classes. Pour relever ces deux défis, nous proposons un réseau de caractéristiques discriminantes (Discriminative Feature Network, DFN) composé de deux sous-réseaux : le réseau lisseur (Smooth Network) et le réseau frontière (Border Network). Plus précisément, pour traiter le problème d'incohérence intra-classe, nous avons conçu spécifiquement un réseau lisseur intégrant un bloc d'attention par canal (Channel Attention Block) et une mise en pool moyenne globale afin de sélectionner les caractéristiques plus discriminantes. De plus, nous proposons un réseau frontière visant à rendre les caractéristiques bilatérales des contours distinctes grâce à une supervision profonde des frontières sémantiques. Grâce à notre DFN proposé, nous obtenons des performances de pointe avec un IOU moyen de 86,2 % sur le jeu de données PASCAL VOC 2012 et un IOU moyen de 80,3 % sur le jeu de données Cityscapes.