HyperAIHyperAI
il y a 2 mois

Distance de Mahalanobis basée sur le transport optimal multi-vue pour la localisation multi-vue des foules

Zhang, Qi ; Zhang, Kaiyi ; Chan, Antoni B. ; Huang, Hui
Distance de Mahalanobis basée sur le transport optimal multi-vue pour la localisation multi-vue des foules
Résumé

La localisation de foules multivues prédit les positions au sol de toutes les personnes dans la scène. Les méthodes typiques estiment généralement d'abord des cartes de densité de foule sur le plan du sol, puis obtiennent les positions de la foule. Cependant, les performances des méthodes existantes sont limitées par l'ambiguïté des cartes de densité dans les zones bondées, où les pics locaux peuvent être atténués. Pour atténuer la faiblesse de la supervision par carte de densité, des méthodes de supervision ponctuelle basées sur le transport optimal ont été proposées pour les tâches de localisation de foules à partir d'une seule image, mais elles n'ont pas encore été explorées pour la localisation de foules multivues. Ainsi, dans cet article, nous proposons une nouvelle perte de transport optimal multivue basée sur la distance de Mahalanobis (M-MVOT), spécifiquement conçue pour la localisation de foules multivues.Premièrement, nous remplaçons le coût de transport basé sur la distance euclidienne par la distance de Mahalanobis, qui définit des contours isovaleurs elliptiques dans la fonction coût dont les directions du grand et du petit axe sont guidées par la direction du rayon de vue. Deuxièmement, la distance objet-caméra dans chaque vue est utilisée pour ajuster davantage le coût de transport optimal de chaque position, où les prédictions erronées éloignées de la caméra sont plus sévèrement pénalisées. Enfin, nous proposons une stratégie pour prendre en compte toutes les vues caméra d'entrée dans la perte du modèle (M-MVOT) en calculant le coût de transport optimal pour chaque point vérité-terrain en fonction de sa caméra la plus proche.Les expériences démontrent l'avantage de la méthode proposée par rapport aux pertes basées sur les cartes de densité ou sur la distance euclidienne courante pour le transport optimal sur plusieurs jeux de données de localisation multivue.Page du projet : https://vcc.tech/research/2024/MVOT.

Distance de Mahalanobis basée sur le transport optimal multi-vue pour la localisation multi-vue des foules | Articles de recherche récents | HyperAI