HyperAIHyperAI
il y a 2 mois

ESPNet : Réseau Efficace avec une Pyramide Spatiale de Convolutions Dilatées pour la Segmentation Sémantique

Sachin Mehta; Mohammad Rastegari; Anat Caspi; Linda Shapiro; Hannaneh Hajishirzi
ESPNet : Réseau Efficace avec une Pyramide Spatiale de Convolutions Dilatées pour la Segmentation Sémantique
Résumé

Nous présentons un réseau neuronal convolutif rapide et efficace, ESPNet, pour la segmentation sémantique d'images à haute résolution sous contraintes de ressources. ESPNet est basé sur un nouveau module convolutif, l'efficient spatial pyramid (ESP), qui est performant en termes de calcul, de mémoire et de puissance. ESPNet est 22 fois plus rapide (sur une GPU standard) et 180 fois plus petit que le réseau de segmentation sémantique d'avant-garde PSPNet, tout en offrant une précision catégorielle seulement 8% inférieure. Nous avons évalué ESPNet sur divers jeux de données de segmentation sémantique, notamment Cityscapes, PASCAL VOC et un jeu de données d'images entières de biopsies mammaires. Sous les mêmes contraintes en mémoire et en calcul, ESPNet surpassent tous les réseaux CNN actuels efficaces tels que MobileNet, ShuffleNet et ENet, tant sur les métriques standards que sur nos nouvelles métriques de performance mesurant l'efficacité sur les appareils embarqués. Notre réseau peut traiter des images à haute résolution à une vitesse de 112 et 9 images par seconde sur une GPU standard et un appareil embarqué, respectivement.

ESPNet : Réseau Efficace avec une Pyramide Spatiale de Convolutions Dilatées pour la Segmentation Sémantique | Articles de recherche | HyperAI