HyperAIHyperAI
il y a 2 mois

Réseau de Raffinement Axial Renforcé pour la Détection d'Objets 3D Mono-oculaire

Lijie Liu; Chufan Wu; Jiwen Lu; Lingxi Xie; Jie Zhou; Qi Tian
Réseau de Raffinement Axial Renforcé pour la Détection d'Objets 3D Mono-oculaire
Résumé

La détection monulaire d'objets 3D vise à extraire la position et les propriétés tridimensionnelles des objets à partir d'une image d'entrée bidimensionnelle. Il s'agit d'un problème mal posé, dont la principale difficulté réside dans la perte d'information due aux caméras qui ne prennent pas en compte la profondeur. Les approches conventionnelles échantillonnent des boîtes englobantes 3D dans l'espace et infèrent la relation entre l'objet cible et chacune d'elles, mais la probabilité de tirer des échantillons efficaces est relativement faible dans l'espace 3D. Pour améliorer l'efficacité de l'échantillonnage, nous proposons de commencer par une prédiction initiale et de la raffiner progressivement jusqu'à la vérité terrain, en modifiant uniquement un paramètre 3D à chaque étape. Cela nécessite de concevoir une politique qui reçoit une récompense après plusieurs étapes, et nous utilisons donc l'apprentissage par renforcement pour l'optimiser. Le cadre proposé, le Réseau de Raffinement Axial Renforcé (RAR-Net), agit comme une étape de post-traitement pouvant être intégré librement dans les méthodes existantes de détection monulaire 3D, et améliore les performances sur le jeu de données KITTI avec des coûts computationnels supplémentaires minimes.

Réseau de Raffinement Axial Renforcé pour la Détection d'Objets 3D Mono-oculaire | Articles de recherche récents | HyperAI