HyperAIHyperAI
il y a 11 jours

Amélioration de la détection de piétons à plusieurs vues grâce à l’extraction généralisée de caractéristiques 3D

{Junghyun Cho, Hyungjoo Jung, Haesol Park, Sithu Aung}
Amélioration de la détection de piétons à plusieurs vues grâce à l’extraction généralisée de caractéristiques 3D
Résumé

Le défi principal du détecteur de piétons à plusieurs vues réside dans l'intégration des caractéristiques spécifiques à chaque vue dans un espace unifié afin d’assurer une perception complète et end-to-end. Les méthodes précédentes de détection à plusieurs vues se sont concentrées sur la projection des caractéristiques issues des vues en perspective sur le plan horizontal, générant ainsi une représentation « vue de dessus » (bird’s eye view, BEV) de la scène. Ce papier propose une architecture simple mais efficace, reposant sur une stratégie non paramétrique d’extraction de caractéristiques 3D. Cette stratégie extrait directement les caractéristiques 2D correspondantes pour chaque voxel valide au sein du volume de caractéristiques 3D, palliant ainsi la perte de caractéristiques pouvant survenir dans les approches antérieures. Le cadre proposé intègre trois nouveaux modules, chacun conçu pour renforcer les capacités de généralisation des systèmes de détection à plusieurs vues. Des expériences étendues démontrent l’efficacité du modèle proposé, atteignant une précision nouvelle et optimale, tant dans des scénarios classiques que, plus particulièrement, dans le cadre d’évaluations de généralisation de scènes.

Amélioration de la détection de piétons à plusieurs vues grâce à l’extraction généralisée de caractéristiques 3D | Articles de recherche récents | HyperAI