HyperAIHyperAI

Command Palette

Search for a command to run...

Repenser la convolution creuse pour la segmentation sémantique d'images

Chen Liang-Chieh Papandreou George Schroff Florian Adam Hartwig

Résumé

Dans ce travail, nous revisitons la convolution dilatée, un outil puissant permettant d’ajuster explicitement le champ de vision du filtre ainsi que de contrôler la résolution des réponses de caractéristiques calculées par les réseaux neuronaux profonds à convolution, dans le cadre de la segmentation sémantique d’images. Pour traiter le problème de la segmentation d’objets à plusieurs échelles, nous concevons des modules qui exploitent la convolution dilatée en cascade ou en parallèle afin de capturer le contexte multi-échelle en adoptant plusieurs taux de dilatation. En outre, nous proposons d’enrichir notre module précédemment introduit, le Atrous Spatial Pyramid Pooling, qui analyse les caractéristiques convolutionnelles à plusieurs échelles, par des caractéristiques au niveau de l’image, codant le contexte global, afin d’améliorer davantage les performances. Nous détaillons également les aspects pratiques de mise en œuvre et partageons notre expérience d’entraînement de notre système. Le système proposé, appelé DeepLabv3, améliore significativement les versions précédentes de DeepLab, sans post-traitement par DenseCRF, et atteint des performances comparables à celles des meilleurs modèles actuels sur le benchmark de segmentation sémantique d’images PASCAL VOC 2012.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp