HyperAIHyperAI
vor 2 Monaten

Mahalanobis-Distanz-basierter Multi-View-Optimaler Transport für die Multi-View-Menschenlokalisation

Zhang, Qi ; Zhang, Kaiyi ; Chan, Antoni B. ; Huang, Hui
Mahalanobis-Distanz-basierter Multi-View-Optimaler Transport für die Multi-View-Menschenlokalisation
Abstract

Die Mehrsicht-People-Localization (Mehr-Sicht-Menschen-Lokalisierung) prognostiziert die Bodenpositionen aller Personen in einer Szene. Typische Methoden schätzen zunächst die Dichtekarten der Menschen auf der Bodenebene und erhalten dann die Positionen der Menschen. Allerdings wird die Leistung bestehender Methoden durch die Unschärfe der Dichtekarten in dicht besuchten Bereichen begrenzt, wo lokale Maxima geglättet werden können. Um diese Schwäche der Dichtekartenüberwachung zu mildern, wurden für Einbild-Menschen-Lokalisierungsaufgaben optimale Transportmethoden basierend auf Punktsupervision vorgeschlagen, jedoch bislang nicht für Mehrsicht-Menschen-Lokalisierung untersucht. Daher schlagen wir in diesem Artikel einen neuen Mahalanobis-Distanz-basierten Mehrsicht-optimalen Transport (M-MVOT)-Verlust vor, der speziell für Mehrsicht-Menschen-Lokalisierung entwickelt wurde.Zunächst ersetzen wir den euklidischen Transportkostenanteil durch die Mahalanobis-Distanz, die elliptische Iso-Konturen in der Kostenfunktion definiert, deren Haupt- und Nebenachsenrichtungen von der Sichtstrahlrichtung geleitet werden. Zweitens wird die Entfernung zwischen Objekt und Kamera in jeder Sicht verwendet, um die optimalen Transportkosten jedes Standorts weiter anzupassen, wobei Fehlvorhersagen weit entfernt von der Kamera stärker bestraft werden. Schließlich schlagen wir eine Strategie vor, um alle Eingangskamerasichten im Modellverlust (M-MVOT) zu berücksichtigen, indem wir den optimalen Transportkostenanteil für jeden Bodenwahrheitspunkt basierend auf seiner nächsten Kamera berechnen. Experimente zeigen den Vorteil des vorgeschlagenen Verfahrens gegenüber Dichte-karte-basierten oder üblichen euklidischen Distanz-basierten optimalen Transportverlustfunktionen auf mehreren Mehrsicht-Menschen-Lokalisierungsdatensätzen.Projektseite: https://vcc.tech/research/2024/MVOT.

Mahalanobis-Distanz-basierter Multi-View-Optimaler Transport für die Multi-View-Menschenlokalisation | Neueste Forschungsarbeiten | HyperAI