HyperAIHyperAI
vor 11 Tagen

KUIELab-MDX-Net: Ein Zwei-Stream-Neuronales Netzwerk für Musik-Demixing

Minseok Kim, Woosung Choi, Jaehwa Chung, Daewon Lee, Soonyoung Jung
KUIELab-MDX-Net: Ein Zwei-Stream-Neuronales Netzwerk für Musik-Demixing
Abstract

In jüngster Zeit wurden zahlreiche auf Deep Learning basierende Methoden für die Musikquellentrennung vorgeschlagen. Einige state-of-the-art Ansätze haben gezeigt, dass das Stapeln vieler Schichten mit zahlreichen Skip-Verbindungen die SDR-Leistung verbessert. Obwohl solche tiefen und komplexen Architekturen eine herausragende Leistung erzielen, erfordern sie in der Regel erhebliche Rechenressourcen und viel Zeit für das Training und die Evaluation. In diesem Artikel wird ein zweistromiges neuronalnetzwerk-basiertes Modell für die Musikdemixing-Aufgabe vorgestellt, das als KUIELab-MDX-Net bezeichnet wird und ein gutes Gleichgewicht zwischen Leistung und benötigten Ressourcen erreicht. Das vorgeschlagene Modell verfügt über einen Zeit-Frequenz-Zweig und einen Zeitbereichs-Zweig, wobei jeder Zweig die Töne jeweils separat trennt. Die Ergebnisse beider Ströme werden anschließend kombiniert, um die endgültige Schätzung zu generieren. KUIELab-MDX-Net erreichte beim Music Demixing Challenge 2021 auf Leaderboard A den zweiten Platz und auf Leaderboard B den dritten Platz. Zudem fasst dieser Artikel die experimentellen Ergebnisse auf einer weiteren Benchmark, der MUSDB18-Datenbank, zusammen. Der Quellcode ist öffentlich verfügbar.

KUIELab-MDX-Net: Ein Zwei-Stream-Neuronales Netzwerk für Musik-Demixing | Neueste Forschungsarbeiten | HyperAI