HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 14 jours

SPAN : Alignement par projection spatiale pour la détection 3D monoculaire d'objets

Yifan Wang Yian Zhao Fanqi Pu Xiaochen Yang Yang Tang Xi Chen Wenming Yang

SPAN : Alignement par projection spatiale pour la détection 3D monoculaire d'objets

Résumé

Les détecteurs 3D monoculaires existants maîtrisent généralement la forte non-linéarité de la régression des boîtes englobantes 3D grâce à un paradigme de prédiction découplée, qui utilise plusieurs branches pour estimer séparément le centre géométrique, la profondeur, les dimensions et l’angle de rotation. Bien que cette stratégie de découplage simplifie le processus d’apprentissage, elle ignore intrinsèquement les contraintes géométriques collaboratives entre les différentes caractéristiques, entraînant ainsi un manque de prior géométrique cohérente, ce qui se traduit par des performances sous-optimales. Pour résoudre ce problème, nous proposons une nouvelle méthode, nommée Alignement Spatial-Projection (SPAN), composée de deux composants clés : (i) l’Alignement des Points Spatiaux impose une contrainte spatiale globale explicite entre la boîte englobante 3D prédite et celle de référence (ground-truth), corrigeant ainsi le décalage spatial induit par la régression découplée des attributs ; (ii) l’Alignement Projection 3D-2D garantit que la projection de la boîte 3D est strictement alignée à l’intérieur de la boîte de détection 2D correspondante sur le plan image, réduisant ainsi l’alignement erroné de projection négligé dans les travaux antérieurs. Pour assurer la stabilité de l’entraînement, nous introduisons également une stratégie d’apprentissage hiérarchique des tâches, qui incorpore progressivement l’alignement spatial-projection au fur et à mesure que les prédictions des attributs 3D s’améliorent, empêchant ainsi la propagation précoce des erreurs entre les attributs. Des expériences étendues montrent que la méthode proposée peut être facilement intégrée à tout détecteur 3D monoculaire établi et permet d’obtenir des améliorations significatives des performances.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
SPAN : Alignement par projection spatiale pour la détection 3D monoculaire d'objets | Articles de recherche | HyperAI