HyperAIHyperAI
il y a 2 mois

Classification sonore environnementale de bout en bout à l'aide d'un réseau neuronal convolutif unidimensionnel

Abdoli, Sajjad ; Cardinal, Patrick ; Koerich, Alessandro Lameiras
Classification sonore environnementale de bout en bout à l'aide d'un réseau neuronal convolutif unidimensionnel
Résumé

Dans cet article, nous présentons une approche de bout en bout pour la classification des sons environnementaux basée sur un réseau neuronal convolutif unidimensionnel (1D CNN) qui apprend une représentation directement à partir du signal audio. Plusieurs couches convolutives sont utilisées pour capturer la structure temporelle fine du signal et apprendre des filtres divers pertinents pour la tâche de classification. L'approche proposée peut traiter des signaux audio de toute longueur, car elle divise le signal en trames chevauchantes à l'aide d'une fenêtre glissante. Différentes architectures prenant en compte plusieurs tailles d'entrée ont été évaluées, y compris l'initialisation de la première couche convolutive avec une banque de filtres Gammatone qui modélise la réponse des filtres auditifs humains dans le cochlée. Les performances de l'approche proposée en termes de classification des sons environnementaux ont été évaluées sur le jeu de données UrbanSound8k, et les résultats expérimentaux montrent qu'elle atteint une précision moyenne de 89 %. Par conséquent, cette approche surpassant la plupart des méthodes d'avant-garde qui utilisent des caractéristiques conçues manuellement ou des représentations bidimensionnelles comme entrée. De plus, l'approche proposée dispose d'un nombre réduit de paramètres par rapport aux autres architectures trouvées dans la littérature, ce qui réduit la quantité de données nécessaires pour l'entraînement.

Classification sonore environnementale de bout en bout à l'aide d'un réseau neuronal convolutif unidimensionnel | Articles de recherche récents | HyperAI