HyperAIHyperAI

Command Palette

Search for a command to run...

Amélioration de la détection de piétons à plusieurs vues grâce à l’extraction généralisée de caractéristiques 3D

Junghyun Cho Hyungjoo Jung Haesol Park Sithu Aung

Résumé

Le défi principal du détecteur de piétons à plusieurs vues réside dans l'intégration des caractéristiques spécifiques à chaque vue dans un espace unifié afin d’assurer une perception complète et end-to-end. Les méthodes précédentes de détection à plusieurs vues se sont concentrées sur la projection des caractéristiques issues des vues en perspective sur le plan horizontal, générant ainsi une représentation « vue de dessus » (bird’s eye view, BEV) de la scène. Ce papier propose une architecture simple mais efficace, reposant sur une stratégie non paramétrique d’extraction de caractéristiques 3D. Cette stratégie extrait directement les caractéristiques 2D correspondantes pour chaque voxel valide au sein du volume de caractéristiques 3D, palliant ainsi la perte de caractéristiques pouvant survenir dans les approches antérieures. Le cadre proposé intègre trois nouveaux modules, chacun conçu pour renforcer les capacités de généralisation des systèmes de détection à plusieurs vues. Des expériences étendues démontrent l’efficacité du modèle proposé, atteignant une précision nouvelle et optimale, tant dans des scénarios classiques que, plus particulièrement, dans le cadre d’évaluations de généralisation de scènes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp