HyperAIHyperAI
vor 2 Monaten

WildDESED: Ein durch LLM gestütztes Datensatz für das System zur Erkennung von Klangereignissen in wilden Haushaltsumgebungen

Xiao, Yang ; Das, Rohan Kumar
WildDESED: Ein durch LLM gestütztes Datensatz für das System zur Erkennung von Klangereignissen in wilden Haushaltsumgebungen
Abstract

Diese Arbeit strebt an, die Forschung zur Sound Ereignis Erkennung (SED) durch die Vorstellung eines neuen, von einem großen Sprachmodell (LLM) unterstützten Datensatzes namens Wild Domestic Environment Sound Event Detection (WildDESED) voranzutreiben. Er wurde als Erweiterung des ursprünglichen DESED-Datensatzes entwickelt, um die vielfältige akustische Variabilität und komplexe Geräusche in häuslichen Umgebungen widerzuspiegeln. Wir nutzten LLMs, um acht verschiedene häusliche Szenarien basierend auf den Ziel-Sound-Kategorien des DESED-Datensatzes zu generieren. Anschließend bereicherten wir diese Szenarien mit einer sorgfältig zusammengestellten Mischung von Geräuschen aus AudioSet und sicherten die Unüberlappung mit den Ziel-Sounds. Für die Untersuchung des WildDESED-Datensatzes setzen wir ein weit verbreitetes konvolutions neuronales rekurrentes Netzwerk ein, das dessen anspruchsvolle Natur verdeutlicht. Danach wenden wir Curriculum Learning an, indem wir die Komplexität der Geräusche allmählich erhöhen, um die Generalisierungsfähigkeiten des Modells bei verschiedenen Geräuschstufen zu verbessern. Unsere Ergebnisse mit diesem Ansatz zeigen Verbesserungen in geräuschreichen Umgebungen und bestätigen somit die Effektivität auf dem WildDESED-Datensatz, was wiederum Fortschritte in der robusten SED-Forschung fördert.

WildDESED: Ein durch LLM gestütztes Datensatz für das System zur Erkennung von Klangereignissen in wilden Haushaltsumgebungen | Neueste Forschungsarbeiten | HyperAI