CGNet : Un réseau guidé par le contexte léger pour la segmentation sémantique

La demande d'appliquer des modèles de segmentation sémantique sur les appareils mobiles augmente rapidement. Les réseaux d'avant-garde actuels possèdent un nombre énorme de paramètres, ce qui les rend inadaptés aux appareils mobiles, tandis que d'autres modèles à faible empreinte mémoire suivent l'esprit des réseaux de classification et ignorent la caractéristique inhérente de la segmentation sémantique. Pour résoudre ce problème, nous proposons un nouveau réseau guidé par le contexte (Context Guided Network, CGNet), qui est un réseau léger et efficace pour la segmentation sémantique. Nous proposons tout d'abord le bloc guidé par le contexte (Context Guided, CG), qui apprend la caractéristique conjointe du trait local et du contexte environnant, et améliore davantage cette caractéristique conjointe avec le contexte global. Sur la base du bloc CG, nous développons le CGNet qui capture l'information contextuelle à tous les stades du réseau et est spécialement conçu pour augmenter la précision de la segmentation. Le CGNet est également soigneusement conçu pour réduire le nombre de paramètres et économiser l'empreinte mémoire. Avec un nombre équivalent de paramètres, le CGNet proposé dépasse significativement les réseaux de segmentation existants. De nombreux expériences sur les ensembles de données Cityscapes et CamVid ont vérifié l'efficacité de l'approche proposée. Plus précisément, sans aucun traitement postérieur ni test multi-échelle, le CGNet proposé atteint une moyenne d'IoU (Intersection over Union) de 64,8% sur Cityscapes avec moins de 0,5 M de paramètres. Le code source complet du système peut être trouvé à l'adresse https://github.com/wutianyiRosun/CGNet.