HyperAIHyperAI
il y a 2 mois

Apporter la généralisation à la détection profonde multi-vue des piétons

Vora, Jeet ; Dutta, Swetanjal ; Jain, Kanishk ; Karthik, Shyamgopal ; Gandhi, Vineet
Apporter la généralisation à la détection profonde multi-vue des piétons
Résumé

La détection multi-vue (MVD) est particulièrement efficace pour la gestion des occultations dans un environnement surpeuplé. Bien que les travaux récents utilisant l'apprentissage profond aient réalisé des progrès significatifs dans ce domaine, ils ont négligé l'aspect de la généralisation, ce qui les rend impraticables pour une mise en œuvre dans le monde réel. L'innovation clé de notre travail consiste à formaliser trois formes critiques de généralisation et à proposer des expériences pour les évaluer : la généralisation avec i) un nombre variable de caméras, ii) des positions de caméra variables, et enfin iii) vers de nouvelles scènes. Nous constatons que les modèles existants de pointe montrent une mauvaise généralisation en s'adaptant excessivement à une seule scène et à une configuration de caméra. Pour répondre à ces préoccupations : a) nous proposons un nouveau jeu de données MVD généralisé (GMVD), intégrant diverses scènes avec des variations du jour, des configurations de caméra différentes, et un nombre variable de caméras ; b) nous discutons des propriétés essentielles pour apporter la généralisation à la MVD et proposons un modèle minimaliste pour les incorporer. Nous menons une série complète d'expériences sur les jeux de données WildTrack, MultiViewX et GMVD afin de souligner la nécessité d'évaluer les capacités de généralisation des méthodes MVD et de démontrer l'efficacité de notre approche proposée. Le code source et le jeu de données proposé sont disponibles à l'adresse suivante : https://github.com/jeetv/GMVD

Apporter la généralisation à la détection profonde multi-vue des piétons | Articles de recherche récents | HyperAI