HyperAIHyperAI
il y a 11 jours

Représentation BEV sans étalonnage pour la perception des infrastructures

Siqi Fan, Zhe Wang, Xiaoliang Huo, Yan Wang, Jingjing Liu
Représentation BEV sans étalonnage pour la perception des infrastructures
Résumé

La détection d’objets BEV (Bird’s Eye View) efficace sur les infrastructures peut considérablement améliorer la compréhension des scènes routières et la perception coopérative véhicule-infrastructure (V2I). Toutefois, les caméras installées sur les infrastructures présentent diverses orientations, et les méthodes précédentes de détection BEV dépendent fortement d’une calibration précise, ce qui s’avère difficile à appliquer concrètement en raison de facteurs naturels inévitables (par exemple, le vent ou la neige). Dans cet article, nous proposons un réseau de représentation BEV sans calibration (CBR), capable d’effectuer une détection 3D basée sur une représentation BEV sans recourir à des paramètres de calibration ni à une supervision supplémentaire sur la profondeur. Plus précisément, nous utilisons deux perceptrons multicouches pour décomposer les caractéristiques issues de la vue perspective vers la vue frontale et la vue BEV, sous une supervision par le fonds induit par les boîtes englobantes. Ensuite, un module de fusion de caractéristiques entre vues correspond aux caractéristiques provenant de vues orthogonales selon leur similarité, tout en renforçant les caractéristiques BEV à l’aide des informations issues de la vue frontale. Les résultats expérimentaux sur le jeu de données DAIR-V2X montrent que CBR atteint des performances acceptables sans nécessiter aucun paramètre de caméra, et qu’il est naturellement insensible aux perturbations dues à la calibration. Nous espérons que CBR pourra servir de référence pour les recherches futures visant à relever les défis pratiques liés à la perception par les infrastructures.

Représentation BEV sans étalonnage pour la perception des infrastructures | Articles de recherche récents | HyperAI