HyperAIHyperAI

Command Palette

Search for a command to run...

TORNADO-Net : segmentation sémantique à variation totale multi-vues avec module Diamond Inception

Martin Gerdzhev Ryan Razani Ehsan Taghavi Bingbing Liu

Résumé

La segmentation sémantique des nuages de points constitue un élément clé de la compréhension de scène en robotique et en conduite autonome. Dans cet article, nous présentons TORNADO-Net, un réseau neuronal dédié à la segmentation sémantique des nuages de points 3D issus de capteurs LiDAR. Notre approche combine une extraction de caractéristiques par projection multi-vues (vue oiseau et vue en portée) avec une architecture encodeur-décodeur basée sur ResNet, enrichie d’un nouveau bloc contextuel en forme de losange. Les méthodes actuelles fondées sur la projection ne tiennent pas suffisamment compte du fait que des points voisins appartiennent généralement à la même classe. Afin d’exploiter mieux cette information locale et de réduire les prédictions bruitées, nous proposons une combinaison des pertes basées sur la variation totale (Total Variation), Lovasz-Softmax et la cross-entropie pondérée. Nous tirons également parti du fait que les données LiDAR offrent un champ de vision de 360 degrés, en utilisant une padding circulaire. Nous démontrons des résultats de pointe sur le jeu de données SemanticKITTI, accompagnés d’évaluations quantitatives détaillées ainsi que de résultats d’ablation approfondis.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp