HyperAIHyperAI

Command Palette

Search for a command to run...

End-to-End Audio Strikes Back: Boosting Augmentations Towards An Effizientes Audio-Klassifikationsnetzwerk

Gazneli Avi ; Zimerman Gadi ; Ridnik Tal ; Sharir Gilad ; Noy Asaf

Zusammenfassung

Während effiziente Architekturen und eine Vielzahl von Erweiterungen für end-to-end-Bildklassifizierungsaufgaben vorgeschlagen und intensiv untersucht wurden, basieren die neuesten Techniken für Audiosklassifizierungen noch immer auf zahlreichen Darstellungen des Audiosignals zusammen mit großen Architekturen, die anhand großer Datensätze feinjustiert wurden. Durch die Nutzung der inhärenten Leichtgewichtigkeit von Audio und neuartiger Audioerweiterung konnten wir ein effizientes end-to-end-Netzwerk mit starker Generalisierungsfähigkeit präsentieren. Experimente mit verschiedenen Soundklassifizierungsdatensätzen zeigen die Effektivität und Robustheit unseres Ansatzes, indem sie in verschiedenen Szenarien stand der Technik entsprechende Ergebnisse erzielen. Der öffentliche Code ist unter folgender URL verfügbar: \href{https://github.com/Alibaba-MIIL/AudioClassfication}{dieser Link}


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
End-to-End Audio Strikes Back: Boosting Augmentations Towards An Effizientes Audio-Klassifikationsnetzwerk | Paper | HyperAI