HyperAIHyperAI

Command Palette

Search for a command to run...

Exploration de la modélisation temporelle centrée sur l'objet pour une détection 3D multi-vue efficace

Shihao Wang Yingfei Liu Tiancai Wang Ying Li Xiangyu Zhang

Résumé

Dans cet article, nous proposons un cadre de modélisation de séquences longues, nommé StreamPETR, pour la détection d'objets 3D multivue. Basé sur la conception de requêtes éparse de la série PETR, nous développons systématiquement un mécanisme temporel centré sur les objets. Le modèle est exécuté en ligne et l'information historique à long terme est propagée par le biais des requêtes d'objets image par image. De plus, nous introduisons une normalisation par couche sensible au mouvement pour modéliser le déplacement des objets. StreamPETR réalise des améliorations significatives des performances avec un coût de calcul négligeable, comparativement à la méthode de référence mono-image. Sur le benchmark standard nuScenes, il s'agit de la première méthode multivue en ligne qui atteint des performances comparables (67,6% NDS & 65,3% AMOTA) aux méthodes basées sur le lidar. La version allégée atteint 45,0% mAP et 31,7 FPS, surpassant la méthode d'état de l'art (SOLOFusion) de 2,3% mAP et étant 1,8 fois plus rapide en termes de FPS. Le code est disponible à l'adresse suivante : https://github.com/exiawsh/StreamPETR.git.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp