HyperAIHyperAI
il y a 2 mois

LinkNet : Exploitation des représentations de l'encodeur pour une segmentation sémantique efficace

Abhishek Chaurasia; Eugenio Culurciello
LinkNet : Exploitation des représentations de l'encodeur pour une segmentation sémantique efficace
Résumé

La segmentation sémantique pixel par pixel pour la compréhension des scènes visuelles doit non seulement être précise, mais également efficace afin d'être utile dans les applications en temps réel. Bien que les algorithmes existants soient précis, ils ne se concentrent pas sur l'utilisation efficace des paramètres du réseau neuronal. Par conséquent, ils sont volumineux en termes de paramètres et de nombre d'opérations, ce qui les rend également lents. Dans cet article, nous proposons une nouvelle architecture de réseau neuronal profond qui permet d'apprendre sans augmentation significative du nombre de paramètres. Notre réseau utilise seulement 11,5 millions de paramètres et 21,2 GFLOPs pour traiter une image de résolution 3x640x360. Il offre des performances de pointe sur le jeu de données CamVid et des résultats comparables sur le jeu de données Cityscapes. Nous comparons également le temps de traitement de notre réseau sur une GPU NVIDIA et un appareil embarqué avec celui des architectures actuelles de pointe pour différentes résolutions d'images.

LinkNet : Exploitation des représentations de l'encodeur pour une segmentation sémantique efficace | Articles de recherche récents | HyperAI