HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux de neurones graphiques 3D pour la segmentation sémantique RGBD

Raquel Urtasun Xiaojuan Qi Sanja Fidler Jiaya Jia Renjie Liao

Résumé

La segmentation sémantique RGBD nécessite un raisonnement conjoint portant sur les informations d’apparence 2D et géométriques 3D. Dans cet article, nous proposons un réseau neuronal à graphes 3D (3DGNN) qui construit un graphe de plus proches voisins (k-NN) à partir d’un nuage de points 3D. Chaque nœud du graphe correspond à un ensemble de points et est associé à un vecteur de représentation cachée initialisée à partir d’une caractéristique d’apparence extraite par un CNN unaire à partir d’images 2D. En s’appuyant sur des fonctions récurrentes, chaque nœud met à jour dynamiquement sa représentation cachée en fonction de son état actuel et des messages reçus de ses voisins. Ce modèle de propagation est déroulé sur un certain nombre d’étapes temporelles, et la représentation finale associée à chaque nœud est utilisée pour prédire la classe sémantique de chaque pixel. Le modèle est entraîné à l’aide de la rétropropagation à travers le temps. Des expériences étendues sur les jeux de données NYUD2 et SUN-RGBD démontrent l’efficacité de notre approche.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp