HyperAIHyperAI
il y a 2 mois

DFANet : Agrégation de Caractéristiques Profondes pour la Segmentation Sémantique en Temps Réel

Hanchao Li; Pengfei Xiong; Haoqiang Fan; Jian Sun
DFANet : Agrégation de Caractéristiques Profondes pour la Segmentation Sémantique en Temps Réel
Résumé

Ce document présente une architecture de réseau neuronal convolutif (CNN) extrêmement efficace nommée DFANet pour la segmentation sémantique sous contraintes de ressources. Notre réseau proposé part d'un seul backbone léger et agrège des caractéristiques discriminantes à travers des cascades de sous-réseaux et de sous-étages respectivement. Grâce à la propagation de caractéristiques multi-échelle, DFANet réduit considérablement le nombre de paramètres, tout en obtenant un champ récepteur suffisant et en améliorant les capacités d'apprentissage du modèle, ce qui permet d'établir un équilibre entre la vitesse et les performances de segmentation. Les expériences menées sur les jeux de données Cityscapes et CamVid démontrent les performances supérieures de DFANet, avec 8 fois moins d'opérations flottantes (FLOPs) et 2 fois plus rapide que les méthodes actuelles les plus performantes pour la segmentation sémantique en temps réel, tout en offrant une précision comparable. Plus précisément, il atteint un Mean IOU de 70,3 % sur l'ensemble de test Cityscapes avec seulement 1,7 GFLOPs et une vitesse de 160 images par seconde (FPS) sur une carte NVIDIA Titan X, et un Mean IOU de 71,3 % avec 3,4 GFLOPs lors de l'inférence sur des images à résolution plus élevée.

DFANet : Agrégation de Caractéristiques Profondes pour la Segmentation Sémantique en Temps Réel | Articles de recherche récents | HyperAI