HyperAIHyperAI
il y a 2 mois

ShelfNet pour une segmentation sémantique rapide

Juntang Zhuang; Junlin Yang; Lin Gu; Nicha Dvornek
ShelfNet pour une segmentation sémantique rapide
Résumé

Dans cet article, nous présentons ShelfNet, une nouvelle architecture pour une segmentation sémantique précise et rapide. Contrairement à la structure simple d'encodeur-décodeur, ShelfNet possède plusieurs paires de branches encodeur-décodeur avec des connexions de saut à chaque niveau spatial, ce qui ressemble à un rayonnage avec plusieurs colonnes. Cette structure en forme de rayonnage peut être considérée comme un ensemble de plusieurs chemins profonds et peu profonds, améliorant ainsi la précision. Nous réduisons considérablement la charge de calcul en diminuant le nombre de canaux, tout en atteignant une haute précision grâce à cette structure unique. De plus, nous proposons une stratégie de poids partagés dans les blocs résiduels, qui réduit le nombre de paramètres sans sacrifier les performances. Comparé aux méthodes populaires non temps-réel telles que PSPNet, notre ShelfNet atteint une vitesse d'inférence 4 fois plus rapide avec une précision similaire sur l'ensemble de données PASCAL VOC. Comparé aux modèles de segmentation temps-réel tels que BiSeNet, notre modèle offre une meilleure précision à vitesse comparable sur l'ensemble de données Cityscapes, permettant son utilisation dans des tâches exigeant une grande rapidité, comme la compréhension des scènes urbaines pour la conduite autonome. De plus, notre ShelfNet atteint 79,0\% mIoU (mean Intersection over Union) sur l'ensemble de données Cityscapes avec un squelette ResNet34, surpassant PSPNet et BiSeNet dotés de squelettes plus importants tels que ResNet101. À travers des expériences approfondies, nous avons validé les performances supérieures de ShelfNet. Nous fournissons un lien vers l'implémentation : \url{https://github.com/juntang-zhuang/ShelfNet-lw-cityscapes}.