HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Sprechen Sie wie Sie handeln? Untersuchung der Pose-basierten Klassifikation von Fahreraktionen mit Spracherkennungsnetzwerken

{Ángel Llamazares Miguel Antunes Santiago Montiel-Marín Luis M. Bergasa Pablo Pardo-Decimavilla}

Abstract

Die Erkennung von Ablenkungen auf der Straße ist entscheidend, um Verkehrsunfälle zu reduzieren. Typischerweise werden videobasierte Netzwerke eingesetzt, sind jedoch aufgrund ihres hohen Rechenaufwands eingeschränkt und empfindlich gegenüber Veränderungen der Blickrichtung. In diesem Paper stellen wir einen neuartigen Ansatz zur Klassifikation von Fahrerhandlungen auf Basis von Körperhaltungen vor, der Spracherkennungsnetzwerke nutzt und gegenüber videobasierten Ansätzen leichter sowie viewpoint-invarianter ist. Wir nutzen die Ähnlichkeit der Informationscodierung zwischen Audio- und Pose-Daten, indem wir Körperhaltungen als zeitliche Schlüsselpunkte darstellen. Unsere Architektur basiert auf Squeezeformer, einem effizienten, auf Aufmerksamkeit basierenden Spracherkennungsnetzwerk. Wir führen eine Reihe von Daten-Augmentierungstechniken ein, um die Generalisierungsfähigkeit zu verbessern. Experimente auf dem Drive&Act-Datensatz zeigen eine überlegene Leistung im Vergleich zu aktuellen State-of-the-Art-Methoden. Zudem untersuchen wir die Integration von Objektinformationen sowie die Auswirkungen von Blickwinkeländerungen. Unsere Ergebnisse unterstreichen die Effektivität und Robustheit von Spracherkennungsnetzwerken bei der Klassifikation von Handlungen auf Basis von Körperhaltungen.

Benchmarks

BenchmarkMethodikMetriken
skeleton-based-action-recognition-on-drivedyalyt
mean per-class accuracy: 43.59

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Sprechen Sie wie Sie handeln? Untersuchung der Pose-basierten Klassifikation von Fahreraktionen mit Spracherkennungsnetzwerken | Forschungsarbeiten | HyperAI