HyperAIHyperAI

Command Palette

Search for a command to run...

Distance de Mahalanobis basée sur le transport optimal multi-vue pour la localisation multi-vue des foules

Qi Zhang Kaiyi Zhang Antoni B. Chan Hui Huang

Résumé

La localisation de foules multivues prédit les positions au sol de toutes les personnes dans la scène. Les méthodes typiques estiment généralement d'abord des cartes de densité de foule sur le plan du sol, puis obtiennent les positions de la foule. Cependant, les performances des méthodes existantes sont limitées par l'ambiguïté des cartes de densité dans les zones bondées, où les pics locaux peuvent être atténués. Pour atténuer la faiblesse de la supervision par carte de densité, des méthodes de supervision ponctuelle basées sur le transport optimal ont été proposées pour les tâches de localisation de foules à partir d'une seule image, mais elles n'ont pas encore été explorées pour la localisation de foules multivues. Ainsi, dans cet article, nous proposons une nouvelle perte de transport optimal multivue basée sur la distance de Mahalanobis (M-MVOT), spécifiquement conçue pour la localisation de foules multivues.Premièrement, nous remplaçons le coût de transport basé sur la distance euclidienne par la distance de Mahalanobis, qui définit des contours isovaleurs elliptiques dans la fonction coût dont les directions du grand et du petit axe sont guidées par la direction du rayon de vue. Deuxièmement, la distance objet-caméra dans chaque vue est utilisée pour ajuster davantage le coût de transport optimal de chaque position, où les prédictions erronées éloignées de la caméra sont plus sévèrement pénalisées. Enfin, nous proposons une stratégie pour prendre en compte toutes les vues caméra d'entrée dans la perte du modèle (M-MVOT) en calculant le coût de transport optimal pour chaque point vérité-terrain en fonction de sa caméra la plus proche.Les expériences démontrent l'avantage de la méthode proposée par rapport aux pertes basées sur les cartes de densité ou sur la distance euclidienne courante pour le transport optimal sur plusieurs jeux de données de localisation multivue.Page du projet : https://vcc.tech/research/2024/MVOT.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp