HyperAIHyperAI

Command Palette

Search for a command to run...

WildDESED: Ein durch LLM gestütztes Datensatz für das System zur Erkennung von Klangereignissen in wilden Haushaltsumgebungen

Yang Xiao Rohan Kumar Das

Zusammenfassung

Diese Arbeit strebt an, die Forschung zur Sound Ereignis Erkennung (SED) durch die Vorstellung eines neuen, von einem großen Sprachmodell (LLM) unterstützten Datensatzes namens Wild Domestic Environment Sound Event Detection (WildDESED) voranzutreiben. Er wurde als Erweiterung des ursprünglichen DESED-Datensatzes entwickelt, um die vielfältige akustische Variabilität und komplexe Geräusche in häuslichen Umgebungen widerzuspiegeln. Wir nutzten LLMs, um acht verschiedene häusliche Szenarien basierend auf den Ziel-Sound-Kategorien des DESED-Datensatzes zu generieren. Anschließend bereicherten wir diese Szenarien mit einer sorgfältig zusammengestellten Mischung von Geräuschen aus AudioSet und sicherten die Unüberlappung mit den Ziel-Sounds. Für die Untersuchung des WildDESED-Datensatzes setzen wir ein weit verbreitetes konvolutions neuronales rekurrentes Netzwerk ein, das dessen anspruchsvolle Natur verdeutlicht. Danach wenden wir Curriculum Learning an, indem wir die Komplexität der Geräusche allmählich erhöhen, um die Generalisierungsfähigkeiten des Modells bei verschiedenen Geräuschstufen zu verbessern. Unsere Ergebnisse mit diesem Ansatz zeigen Verbesserungen in geräuschreichen Umgebungen und bestätigen somit die Effektivität auf dem WildDESED-Datensatz, was wiederum Fortschritte in der robusten SED-Forschung fördert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
WildDESED: Ein durch LLM gestütztes Datensatz für das System zur Erkennung von Klangereignissen in wilden Haushaltsumgebungen | Paper | HyperAI