HyperAIHyperAI
il y a 2 mois

Régression et classification pour l’estimation de la direction d’arrivée avec des réseaux neuronaux convolutifs récurrents

Zhenyu Tang; John D. Kanu; Kevin Hogan; Dinesh Manocha
Régression et classification pour l’estimation de la direction d’arrivée avec des réseaux neuronaux convolutifs récurrents
Résumé

Nous présentons une nouvelle approche basée sur l'apprentissage pour estimer la direction d'arrivée (DOA) d'une source sonore en utilisant un réseau neuronal convolutif récurrent (CRNN) formé par régression sur des données synthétiques et des étiquettes cartésiennes. Nous décrivons également une méthode améliorée pour générer des données synthétiques afin de former le réseau neuronal, en utilisant des algorithmes de propagation du son de pointe qui modélisent à la fois les réflexions spéculaires et diffuses du son. Nous comparons notre modèle à trois autres CRNN formés en utilisant différentes formulations du même problème : classification sur des étiquettes catégorielles et régression sur des étiquettes en coordonnées sphériques. En pratique, notre modèle permet une réduction de l'erreur angulaire allant jusqu'à 43 % par rapport aux méthodes précédentes. L'utilisation de réflexions diffuses entraîne une diminution respective de 34 % et 41 % des erreurs de prédiction angulaire sur les jeux de données LOCATA et SOFA, par rapport aux méthodes antérieures basées sur les méthodes d'image-source. Notre méthode permet une réduction supplémentaire de 3 % des erreurs par rapport aux schémas précédents utilisant des réseaux basés sur la classification, tout en utilisant 36 % moins de paramètres du réseau.

Régression et classification pour l’estimation de la direction d’arrivée avec des réseaux neuronaux convolutifs récurrents | Articles de recherche récents | HyperAI