HyperAIHyperAI
vor 2 Monaten

Generalisierung in der tiefen multiview-basierten Fußgängererkennung bringen

Vora, Jeet ; Dutta, Swetanjal ; Jain, Kanishk ; Karthik, Shyamgopal ; Gandhi, Vineet
Generalisierung in der tiefen multiview-basierten Fußgängererkennung bringen
Abstract

Die Multi-View-Detektion (MVD) ist hoch effektiv für die Verdeckungsanalyse in dicht besiedelten Umgebungen. Obwohl kürzliche Arbeiten im Bereich des tiefen Lernens erhebliche Fortschritte in diesem Feld erzielt haben, wurden sie hinsichtlich der Generalisierung vernachlässigt, was ihre praktische Anwendung in der Realität erschwert. Der wesentliche Neuerungspunkt unserer Arbeit besteht darin, drei entscheidende Formen der Generalisierung zu formalisieren und Experimente zur deren Bewertung vorzuschlagen: Generalisierung bei i) einer variierenden Anzahl von Kameras, ii) variierenden Kamerapositionen und schließlich iii) neuen Szenen. Wir stellen fest, dass existierende state-of-the-art-Modelle eine schwache Generalisierung aufweisen, da sie an eine einzelne Szene und eine bestimmte Kameraanordnung angepasst sind. Um diese Bedenken zu adressieren: (a) schlagen wir ein neues Generalized MVD (GMVD)-Datensatz vor, der verschiedene Szenarien mit unterschiedlichen Tageszeiten, Kameraanordnungen und einer variierenden Anzahl von Kameras umfasst; (b) diskutieren wir die Eigenschaften, die für die Verbesserung der Generalisierung bei MVD wesentlich sind, und präsentieren ein minimalistisches Modell zur Integration dieser Eigenschaften. Wir führen umfassende Experimente auf den Datensätzen WildTrack, MultiViewX und GMVD durch, um die Notwendigkeit der Bewertung der Generalisierungsfähigkeiten von MVD-Methoden zu unterstreichen und die Effizienz des vorgeschlagenen Ansatzes zu demonstrieren. Der Code und das vorgeschlagene Datensatz sind unter https://github.com/jeetv/GMVD abrufbar.

Generalisierung in der tiefen multiview-basierten Fußgängererkennung bringen | Neueste Forschungsarbeiten | HyperAI