HyperAIHyperAI

Command Palette

Search for a command to run...

KUIELab-MDX-Net: Ein Zwei-Stream-Neuronales Netzwerk für Musik-Demixing

Minseok Kim Woosung Choi Jaehwa Chung Daewon Lee Soonyoung Jung

Zusammenfassung

In jüngster Zeit wurden zahlreiche auf Deep Learning basierende Methoden für die Musikquellentrennung vorgeschlagen. Einige state-of-the-art Ansätze haben gezeigt, dass das Stapeln vieler Schichten mit zahlreichen Skip-Verbindungen die SDR-Leistung verbessert. Obwohl solche tiefen und komplexen Architekturen eine herausragende Leistung erzielen, erfordern sie in der Regel erhebliche Rechenressourcen und viel Zeit für das Training und die Evaluation. In diesem Artikel wird ein zweistromiges neuronalnetzwerk-basiertes Modell für die Musikdemixing-Aufgabe vorgestellt, das als KUIELab-MDX-Net bezeichnet wird und ein gutes Gleichgewicht zwischen Leistung und benötigten Ressourcen erreicht. Das vorgeschlagene Modell verfügt über einen Zeit-Frequenz-Zweig und einen Zeitbereichs-Zweig, wobei jeder Zweig die Töne jeweils separat trennt. Die Ergebnisse beider Ströme werden anschließend kombiniert, um die endgültige Schätzung zu generieren. KUIELab-MDX-Net erreichte beim Music Demixing Challenge 2021 auf Leaderboard A den zweiten Platz und auf Leaderboard B den dritten Platz. Zudem fasst dieser Artikel die experimentellen Ergebnisse auf einer weiteren Benchmark, der MUSDB18-Datenbank, zusammen. Der Quellcode ist öffentlich verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp