HyperAIHyperAI

Command Palette

Search for a command to run...

PersFormer : Détection de voies en 3D par le biais du Perspective Transformer et du benchmark OpenLane

Résumé

Des méthodes de détection de voies en 3D ont été récemment proposées pour résoudre le problème des tracés de voies inexactes dans de nombreux scénarios d conduite autonome (montée/descente de côte, bosses, etc.). Les travaux précédents peinaient dans les cas complexes en raison de leurs conceptions simplistes de la transformation spatiale entre la vue frontale et la vue aérienne (BEV) ainsi que du manque d'un ensemble de données réaliste. Pour répondre à ces problèmes, nous présentons PersFormer : un détecteur monulaire de voies en 3D basé sur un module novateur de transformation des caractéristiques spatiales utilisant le Transformer. Notre modèle génère des caractéristiques BEV en se concentrant sur les régions locales frontales pertinentes avec les paramètres caméra comme référence. PersFormer adopte une conception d'ancre unifiée 2D/3D et une tâche auxiliaire pour détecter simultanément les voies 2D et 3D, ce qui améliore la cohérence des caractéristiques et partage les avantages de l'apprentissage multi-tâches. De plus, nous mettons à disposition l'un des premiers grands ensembles de données réelles de voies en 3D : OpenLane, doté d'une annotation de haute qualité et d'une diversité de scénarios. OpenLane contient 200 000 images, plus de 880 000 voies au niveau des instances, 14 catégories de voies, ainsi que des balises de scène et des annotations d'objets situés près du chemin pour encourager le développement des méthodes de détection de voies et d'autres techniques liées à la conduite autonome industrielle. Nous montrons que PersFormer surpasse considérablement les lignes directrices concurrentes dans la tâche de détection de voies en 3D sur notre nouveau jeu de données OpenLane ainsi que sur le jeu de données synthétique Apollo 3D Lane, tout en étant comparable aux algorithmes les plus avancés dans la tâche 2D sur OpenLane. La page du projet est disponible à l'adresse https://github.com/OpenPerceptionX/PersFormer_3DLane et le jeu de données OpenLane est fourni à https://github.com/OpenPerceptionX/OpenLane.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
PersFormer : Détection de voies en 3D par le biais du Perspective Transformer et du benchmark OpenLane | Articles | HyperAI