HyperAIHyperAI
vor 2 Monaten

Regression und Klassifikation für die Schätzung der Einfallsrichtung mit konvolutionellen rekurrenten Neuronalen Netzen

Zhenyu Tang; John D. Kanu; Kevin Hogan; Dinesh Manocha
Regression und Klassifikation für die Schätzung der Einfallsrichtung mit konvolutionellen rekurrenten Neuronalen Netzen
Abstract

Wir präsentieren einen neuen, lernbasierten Ansatz zur Schätzung der Einfallsrichtung (Direction-of-Arrival, DOA) einer Schallquelle unter Verwendung eines konvolutionellen rekurrenten neuronalen Netzes (Convolutional Recurrent Neural Network, CRNN), das durch Regression auf synthetischen Daten und kartesischen Labels trainiert wurde. Darüber hinaus beschreiben wir eine verbesserte Methode zur Generierung von synthetischen Daten, um das neuronale Netzwerk mit Hilfe modernster Schallausbreitungsalgorithmen zu trainieren, die sowohl spekular als auch diffus gestreute Schallreflexionen modellieren. Wir vergleichen unser Modell mit drei anderen CRNNs, die unter Verwendung verschiedener Formulierungen des gleichen Problems trainiert wurden: Klassifikation auf kategorialen Labels und Regression auf sphärischen Koordinatenlabels. In der Praxis erreicht unser Modell bis zu 43 % geringere Winkelfehler im Vergleich zu vorherigen Methoden. Die Verwendung von diffuser Reflexion führt zu einer Reduktion der Winkelprediktionsfehler um 34 % und 41 % in den LOCATA- und SOFA-Datensätzen jeweils im Vergleich zu früheren Methoden, die auf Bildquelle-Methoden basieren. Unsere Methode ergibt eine zusätzliche Reduktion des Fehlers um 3 % im Vergleich zu früheren Schemata, die klassifikationsbasierte Netze verwenden, und wir nutzen dabei 36 % weniger Netzwerkparameter.

Regression und Klassifikation für die Schätzung der Einfallsrichtung mit konvolutionellen rekurrenten Neuronalen Netzen | Neueste Forschungsarbeiten | HyperAI