HyperAIHyperAI

Command Palette

Search for a command to run...

BEVFormer v2 : Adapter les architectures modernes d’images aux reconnaissances en vue de dessus par une supervision perspective

Résumé

Nous présentons un nouveau détecteur vue de dessus (BEV) supervisé par espace perspective, qui converge plus rapidement et s’intègre mieux aux architectures modernes d’images. Les détecteurs BEV d’état de l’art actuels sont souvent associés à des architectures pré-entraînées en profondeur spécifiques, comme VoVNet, ce qui limite l’harmonisation entre les architectures d’images en plein essor et les détecteurs BEV. Pour surmonter cette limitation, nous privilégions une simplification de l’optimisation des détecteurs BEV en introduisant une supervision dans l’espace perspective. À cette fin, nous proposons un détecteur BEV en deux étapes, où les propositions issues de la tête perspective sont transmises à la tête vue de dessus pour produire les prédictions finales. Pour évaluer l’efficacité de notre modèle, nous menons des études ablatives approfondies portant sur la forme de la supervision et la généralité du détecteur proposé. La méthode proposée est validée sur une large gamme d’architectures d’images traditionnelles et modernes, et atteint de nouveaux résultats SOTA sur le grand jeu de données nuScenes. Le code sera bientôt publié.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp