HyperAIHyperAI

Command Palette

Search for a command to run...

End-to-End-Umgebungsgeräuschklassifizierung mit einem eindimensionalen Faltungsneuralen Netzwerk

Sajjad Abdoli Patrick Cardinal Alessandro Lameiras Koerich

Zusammenfassung

In dieser Arbeit stellen wir einen end-to-end Ansatz für die Klassifizierung von Umgebungsgeräuschen vor, der auf einem eindimensionalen Faltungsneuralen Netzwerk (CNN) basiert und eine Darstellung direkt aus dem Audiosignal lernt. Mehrere Faltungsschichten werden verwendet, um die feine zeitliche Struktur des Signals zu erfassen und vielfältige Filter zu lernen, die für die Klassifizierungsaufgabe relevant sind. Der vorgeschlagene Ansatz kann Audiosignale beliebiger Länge verarbeiten, da er das Signal mit einem gleitenden Fenster in überlappende Frames unterteilt. Verschiedene Architekturen mit unterschiedlichen Eingabegrößen wurden evaluiert, darunter die Initialisierung der ersten Faltungsschicht mit einer Gammaton-Filterbank, die die menschliche Hörfilterantwort im Cochlea modelliert. Die Leistung des vorgeschlagenen end-to-end Ansatzes bei der Klassifizierung von Umgebungsgeräuschen wurde am UrbanSound8k-Datensatz evaluiert, und die experimentellen Ergebnisse haben gezeigt, dass er eine durchschnittliche Genauigkeit von 89 % erreicht. Somit übertrifft der vorgeschlagene Ansatz die meisten der aktuellen Ansätze, die handgefertigte Merkmale oder zweidimensionale Darstellungen als Eingabe verwenden. Darüber hinaus hat der vorgeschlagene Ansatz im Vergleich zu anderen in der Literatur gefundenen Architekturen eine geringe Anzahl von Parametern, was den Datenumfang reduziert, der für das Training erforderlich ist.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp