HyperAIHyperAI
vor 2 Monaten

End-to-End Audio Strikes Back: Boosting Augmentations Towards An Effizientes Audio-Klassifikationsnetzwerk

Gazneli, Avi ; Zimerman, Gadi ; Ridnik, Tal ; Sharir, Gilad ; Noy, Asaf
End-to-End Audio Strikes Back: Boosting Augmentations Towards An
Effizientes Audio-Klassifikationsnetzwerk
Abstract

Während effiziente Architekturen und eine Vielzahl von Erweiterungen für end-to-end-Bildklassifizierungsaufgaben vorgeschlagen und intensiv untersucht wurden, basieren die neuesten Techniken für Audiosklassifizierungen noch immer auf zahlreichen Darstellungen des Audiosignals zusammen mit großen Architekturen, die anhand großer Datensätze feinjustiert wurden. Durch die Nutzung der inhärenten Leichtgewichtigkeit von Audio und neuartiger Audioerweiterung konnten wir ein effizientes end-to-end-Netzwerk mit starker Generalisierungsfähigkeit präsentieren. Experimente mit verschiedenen Soundklassifizierungsdatensätzen zeigen die Effektivität und Robustheit unseres Ansatzes, indem sie in verschiedenen Szenarien stand der Technik entsprechende Ergebnisse erzielen. Der öffentliche Code ist unter folgender URL verfügbar: \href{https://github.com/Alibaba-MIIL/AudioClassfication}{dieser Link}

End-to-End Audio Strikes Back: Boosting Augmentations Towards An Effizientes Audio-Klassifikationsnetzwerk | Neueste Forschungsarbeiten | HyperAI