HyperAIHyperAI
il y a 2 mois

RTM3D : Détection en temps réel de 3D monulaire à partir des points clés des objets pour la conduite autonome

Peixuan Li; Huaici Zhao; Pengfei Liu; Feidao Cao
RTM3D : Détection en temps réel de 3D monulaire à partir des points clés des objets pour la conduite autonome
Résumé

Dans cette étude, nous proposons un cadre de détection 3D monoculaire efficace et précis en une seule étape. La plupart des détecteurs 3D réussis utilisent la contrainte de projection du boîtier englobant 3D vers le boîtier englobant 2D comme composante importante. Les quatre bords d'une boîte 2D ne fournissent que quatre contraintes, et les performances se dégradent considérablement avec l'erreur minimale du détecteur 2D. Contrairement à ces approches, notre méthode prédit les neuf points clés de perspective d'un boîtier englobant 3D dans l'espace image, puis utilise la relation géométrique entre les perspectives 3D et 2D pour récupérer la dimension, la position et l'orientation dans l'espace 3D. Dans cette méthode, les propriétés de l'objet peuvent être prédites de manière stable même lorsque l'estimation des points clés est très bruyante, ce qui nous permet d'obtenir une vitesse de détection rapide avec une architecture réduite. L'entraînement de notre méthode n'utilise que les propriétés 3D de l'objet sans nécessiter des réseaux externes ou des données de supervision. Notre méthode est le premier système en temps réel pour la détection 3D d'images monoculaires tout en atteignant des performances de pointe sur le benchmark KITTI. Le code sera publié sur https://github.com/Banconxuan/RTM3D.

RTM3D : Détection en temps réel de 3D monulaire à partir des points clés des objets pour la conduite autonome | Articles de recherche récents | HyperAI