HyperAIHyperAI
il y a 8 jours

Prévoir votre vue avec attention : estimation de la disposition de la scène routière à partir d'une seule vue par transformation entre vues

{Jia Pan, Shengfeng He, Yuexin Ma, Yuanlong Yu, Wenxi Liu, Qi Li, Weixiang Yang}
Prévoir votre vue avec attention : estimation de la disposition de la scène routière à partir d'une seule vue par transformation entre vues
Résumé

La reconstruction de cartes haute définition (HD) est essentielle pour les véhicules autonomes. Les méthodes basées sur les capteurs LiDAR sont limitées par le coût élevé des capteurs déployés et par les calculs intensifs qu’elles nécessitent. Les approches basées sur les caméras doivent généralement effectuer séparément la segmentation de la chaussée et la transformation de vue, ce qui entraîne souvent des distorsions et des pertes de contenu. Pour repousser les limites de cette technologie, nous proposons un cadre novateur permettant de reconstruire une carte locale composée de la disposition de la chaussée et de l’occupation par les véhicules, dans une vue de dessus (bird’s-eye view), à partir d’une simple image monochrome en vue avant. Plus précisément, nous introduisons un module de transformation entre vues qui prend en compte la contrainte de cohérence cyclique entre les vues et exploite pleinement les corrélations entre celles-ci afin de renforcer la transformation de vue et la compréhension de la scène. En tenant compte des relations entre les véhicules et la chaussée, nous avons également conçu un discriminateur conscient du contexte pour affiner davantage les résultats. Les expériences sur des benchmarks publics montrent que notre méthode atteint un niveau d’expertise (state-of-the-art) pour les tâches d’estimation de la disposition de la chaussée et d’estimation de l’occupation par les véhicules. En particulier, pour la dernière tâche, notre modèle surpasse tous les concurrents de manière significative. En outre, notre modèle fonctionne à 35 FPS sur une seule GPU, ce qui en fait une solution efficace et applicable à la reconstruction en temps réel de cartes panoramiques haute définition.