HyperAIHyperAI

Command Palette

Search for a command to run...

Sudo rm -rf: Effiziente Netzwerke für universelle Audio-Quellentrennung

Efthymios Tzinis Zhepei Wang Paris Smaragdis

Zusammenfassung

In diesem Artikel präsentieren wir ein effizientes neuronales Netzwerk für die end-to-end-Allzweck-Audioquellentrennung. Konkret basiert die Grundstruktur dieses Faltungsnetzwerks auf der SUccessive DOwnsampling und Resampling of Multi-Resolution Features (SuDoRMRF) sowie deren Aggregation mittels einfacher eindimensionaler Faltungen. Auf diese Weise erreichen wir eine hochwertige Audioquellentrennung mit einer begrenzten Anzahl an Fließkomma-Operationen, geringen Speicheranforderungen, wenigen Parametern und geringer Latenz. Unsere Experimente an Datensätzen für Sprach- und Umgebungsgeräuschtrennung zeigen, dass SuDoRMRF vergleichbare und sogar überlegene Ergebnisse erzielt im Vergleich zu verschiedenen state-of-the-art-Ansätzen, die jedoch deutlich höhere rechnerische Ressourcen erfordern.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Sudo rm -rf: Effiziente Netzwerke für universelle Audio-Quellentrennung | Paper | HyperAI