HyperAIHyperAI

Command Palette

Search for a command to run...

BEVDepth : Acquisition of Reliable Depth for Multi-view 3D Object Detection

Yinhao Li Zheng Ge Guanyi Yu Jinrong Yang Zengran Wang Yukang Shi Jianjian Sun Zeming Li

Résumé

Dans cette recherche, nous proposons un nouveau détecteur d’objets 3D basé sur des caméras, doté d’une estimation de profondeur fiable, appelé BEVDepth, pour la détection d’objets 3D en vue de dessus (Bird’s-Eye-View, BEV). Notre travail s’appuie sur une observation clé : les approches récentes présentent une estimation de profondeur surprenamment insuffisante, alors que la profondeur est essentielle à la détection 3D à partir de caméras. BEVDepth résout ce problème en exploitant une supervision explicite de la profondeur. Nous introduisons également un module d’estimation de profondeur conscient des caméras, afin d’améliorer la capacité de prédiction de profondeur. Par ailleurs, nous concevons un nouveau module de raffinement de profondeur pour atténuer les effets secondaires dus à l’imprécision de la déprojection des caractéristiques. Grâce à un pooling de voxels efficace personnalisé et à un mécanisme multi-images, BEVDepth atteint une nouvelle meilleure performance mondiale de 60,9 % en NDS sur le jeu de test exigeant nuScenes, tout en maintenant une haute efficacité. Pour la première fois, le score NDS atteint 60 % pour un modèle basé uniquement sur des caméras.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp