Réseaux de Neurones Récursifs avec Couches Stochastiques pour la Détection de la Nouveauté Acoustique

Dans cet article, nous adaptons les Réseaux de Neurones Récurents avec Couches Stochastiques (Recurrent Neural Networks with Stochastic Layers), qui sont à l'état de l'art pour la génération de texte, de musique et de parole, au problème de détection acoustique de la nouveauté. En intégrant l'incertitude dans les états cachés, ce type de réseau est capable d'apprendre la distribution de séquences complexes. Étant donné que la distribution apprise peut être calculée explicitement en termes de probabilité, nous pouvons évaluer la probabilité d'une observation et détecter les événements à faible probabilité comme étant nouveaux. Le modèle est robuste, hautement non supervisé, end-to-end et nécessite un prétraitement minimal, ainsi qu'une ingénierie des caractéristiques ou un réglage des hyperparamètres limités. Une expérience sur un jeu de données de référence montre que notre modèle surpasses les détecteurs acoustiques de nouveauté à l'état de l'art.