Ein neuartiger Ansatz zur automatischen akustischen Neuheitserkennung unter Verwendung eines Rauschunterdrückungs-Autoencoders mit bidirektionalen LSTM-Neuralnetzwerken
Die akustische Novelty-Detektion zielt darauf ab, abnorme/neue akustische Signale zu identifizieren, die sich von den Referenz-/Normaldaten unterscheiden, mit denen das System trainiert wurde. In diesem Beitrag präsentieren wir einen neuartigen, unsupervisierten Ansatz, der auf einem Rauschunterdrückungs-Autoencoder basiert. In unserem Ansatz werden auditive spektrale Merkmale mittels eines Rauschunterdrückungs-Autoencoders mit bidirektionalen Long Short-Term Memory (LSTM)-rekurrenten neuronalen Netzen verarbeitet. Wir nutzen den Rekonstruktionsfehler zwischen Eingabe und Ausgabe des Autoencoders als Aktivierungssignal zur Erkennung neuer Ereignisse. Der Autoencoder wurde auf einer öffentlichen Datenbank trainiert, die Aufnahmen typischer häuslicher Situationen wie Sprechen, Fernsehen, Spielen und Essen enthält. Die Evaluation erfolgte an mehr als 260 verschiedenen abnormalen Ereignissen. Wir vergleichen unsere Ergebnisse mit Stand der Technik und schließen, dass unser neuartiger Ansatz bestehende Methoden signifikant übertrifft und bis zu einem F-Maß von 93,4 % erreicht.