HyperAIHyperAI

Command Palette

Search for a command to run...

RedNet : Réseau Encodeur-Décodeur Résiduel pour la Segmentation Sémantique RGB-D en Intérieur

Jindong Jiang Lunan Zheng Fei Luo Zhijun Zhang

Résumé

La segmentation sémantique intérieure a toujours été une tâche difficile en vision par ordinateur. Dans cet article, nous proposons une architecture d'encodeur-décodeur résiduelle RGB-D, nommée RedNet, pour la segmentation sémantique RGB-D intérieure. Dans RedNet, le module résiduel est appliqué à la fois à l'encodeur et au décodeur comme bloc de base, et la connexion de saut (skip-connection) est utilisée pour contourner les caractéristiques spatiales entre l'encodeur et le décodeur. Afin d'intégrer les informations de profondeur de la scène, une structure de fusion est construite, qui effectue des inférences séparément sur l'image RGB et l'image de profondeur, puis fusionne leurs caractéristiques sur plusieurs couches. Pour optimiser efficacement les paramètres du réseau, nous proposons un schéma d'entraînement appelé « supervision pyramidale » (pyramid supervision), qui applique l'apprentissage supervisé sur différentes couches du décodeur afin de faire face au problème d'évanouissement des gradients (gradients vanishing). Les résultats expérimentaux montrent que le RedNet proposé (basé sur ResNet-50) atteint une précision mIoU de pointe de 47,8 % sur le jeu de données SUN RGB-D.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp