Une nouvelle approche pour la détection automatique de nouveauté acoustique utilisant un autoencodeur débruitant couplé à des réseaux neuronaux LSTM bidirectionnels
La détection de nouveauté acoustique vise à identifier des signaux acoustiques anormaux ou nouveaux, qui diffèrent des données de référence ou normales avec lesquelles le système a été entraîné. Dans cet article, nous présentons une nouvelle approche non supervisée fondée sur un autoencodeur débruitant. Dans notre méthode, les caractéristiques spectrales auditives sont traitées par un autoencodeur débruitant intégrant des réseaux de neurones récurrents à mémoire à long et court terme (LSTM) bidirectionnels. Nous utilisons l'erreur de reconstruction entre l'entrée et la sortie de l'autoencodeur comme signal d'activation pour détecter les événements nouveaux. L'autoencodeur est entraîné sur une base de données publique comprenant des enregistrements de situations typiques au sein d’un foyer, telles que des conversations, la télévision, des jeux ou des repas. L’évaluation a été réalisée sur plus de 260 événements anormaux différents. Nous comparons nos résultats aux méthodes de pointe actuelles et concluons que notre approche novatrice surpasse significativement les méthodes existantes, atteignant un F-mesure maximal de 93,4 %.