HyperAIHyperAI

Command Palette

Search for a command to run...

PETRv2 : Un cadre unifié pour la perception 3D à partir d'images multicaméra

Yingfei Liu Junjie Yan Fan Jia Shuailin Li Aqi Gao Tiancai Wang* Xiangyu Zhang Jian Sun

Résumé

Dans cet article, nous proposons PETRv2, un cadre unifié pour la perception 3D à partir d'images multi-vues. Basé sur PETR, PETRv2 explore l'efficacité de la modélisation temporelle, qui utilise les informations temporelles des cadres précédents pour améliorer la détection d'objets 3D. Plus précisément, nous étendons le codage de position 3D (3D PE) dans PETR pour la modélisation temporelle. Le 3D PE réalise l'alignement temporel des positions des objets entre différents cadres. Un encodeur de position guidé par les caractéristiques est également introduit pour améliorer l'adaptabilité des données du 3D PE. Pour soutenir l'apprentissage multi-tâches (par exemple, la segmentation en vue bird's-eye et la détection de voies 3D), PETRv2 fournit une solution simple mais efficace en introduisant des requêtes spécifiques à chaque tâche, qui sont initialisées dans différents espaces. PETRv2 atteint des performances de pointe en détection d'objets 3D, segmentation en vue bird's-eye et détection de voies 3D. Une analyse détaillée de la robustesse est également menée sur le cadre PETR. Nous espérons que PETRv2 puisse servir de solide référence pour la perception 3D. Le code source est disponible à l'adresse \url{https://github.com/megvii-research/PETR}.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
PETRv2 : Un cadre unifié pour la perception 3D à partir d'images multicaméra | Articles | HyperAI