HyperAIHyperAI

Command Palette

Search for a command to run...

MonoDTR : Détection monulaire d'objets 3D avec Transformers sensibles à la profondeur

Huang Kuan-Chih ; Wu Tsung-Han ; Su Hung-Ting ; Hsu Winston H.

Résumé

La détection d'objets 3D monoculaire est une tâche importante mais complexe dans le domaine de la conduite autonome. Certaines méthodes existantes utilisent des informations de profondeur provenant d'un estimateur de profondeur prêt à l'emploi pour aider à la détection 3D, mais elles souffrent d'un fardeau informatique supplémentaire et obtiennent des performances limitées en raison de priorités de profondeur inexactes. Pour atténuer ces problèmes, nous proposons MonoDTR, un réseau neuronal transformateur innovant et intégré prenant en compte la profondeur pour la détection d'objets 3D monoculaire. Ce réseau se compose principalement de deux composants : (1) le module d'amélioration des caractéristiques prenant en compte la profondeur (Depth-Aware Feature Enhancement, DFE) qui apprend implicitement des caractéristiques sensibles à la profondeur avec une supervision auxiliaire sans nécessiter de calculs supplémentaires, et (2) le module transformateur prenant en compte la profondeur (Depth-Aware Transformer, DTR) qui intègre globalement des caractéristiques contextuelles et sensibles à la profondeur. De plus, contrairement aux encodages positionnels pixel par pixel conventionnels, nous introduisons un nouvel encodage positionnel de profondeur (Depth Positional Encoding, DPE) pour injecter des indices positionnels de profondeur dans les transformateurs. Nos modules proposés prenant en compte la profondeur peuvent être facilement intégrés aux détecteurs d'objets 3D monoculaires existants basés uniquement sur les images afin d'améliorer leurs performances. Des expériences approfondies sur l'ensemble de données KITTI montrent que notre approche surpassent les méthodes précédentes basées sur une seule caméra et atteint une détection en temps réel. Le code source est disponible à l'adresse suivante : https://github.com/kuanchihhuang/MonoDTR


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp