HyperAIHyperAI

Command Palette

Search for a command to run...

Réinterpréter la convolution dilatée pour une segmentation sémantique en temps réel

Roland Gao

Résumé

Le champ de vue constitue une métrique essentielle lors de la conception d’un modèle pour la segmentation sémantique. Afin d’obtenir un champ de vue étendu, les approches antérieures optent généralement pour un abaissement rapide de la résolution, souvent via des opérations de moyenne (average pooling) ou des convolutions à pas 2. Nous adoptons une approche différente en utilisant des convolutions dilatées à taux de dilatation élevés tout au long du noyau (backbone), permettant ainsi au noyau d’ajuster facilement son champ de vue en modulant simplement les taux de dilatation, tout en montrant que notre méthode est compétitive par rapport aux approches existantes. Pour exploiter efficacement les convolutions dilatées, nous établissons une borne supérieure simple sur le taux de dilatation afin d’éviter tout vide entre les poids de convolution, et concevons une structure de bloc inspirée de SE-ResNeXt, qui utilise deux convolutions 3×33\times 33×3 en parallèle avec des taux de dilatation différents, afin de préserver les détails locaux. Le réglage manuel des taux de dilatation pour chaque bloc peut s’avérer difficile, aussi introduisons-nous une méthode de recherche d’architecture neuronale différentiable, qui utilise la descente de gradient pour optimiser automatiquement les taux de dilatation. En outre, nous proposons un décodeur léger, capable de restaurer plus efficacement les informations locales que les alternatives courantes. Pour démontrer l’efficacité de notre approche, notre modèle RegSeg obtient des résultats compétitifs sur les jeux de données en temps réel Cityscapes et CamVid. Sur une GPU T4 utilisant une précision mixte, RegSeg atteint 78,3 mIOU sur l’ensemble de test Cityscapes à 37 FPS, et 80,9 mIOU sur l’ensemble de test CamVid à 112 FPS, sans pré-entraînement sur ImageNet.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp