Open-Unmix – Eine Referenzimplementierung für die Musikquellentrennung

Die Musikquellentrennung ist die Aufgabe, Musik in ihre grundlegenden Komponenten zu zerlegen, beispielsweise die separaten Spuren für Gesang, Bass und Schlagzeug zu erzeugen. Eine solche Trennung besitzt zahlreiche Anwendungen, die von der Umgestaltung oder Neupurposierung der Spuren (Remixing, Repanning, Upmixing) bis zur vollständigen Extraktion (Karaoke, Sample-Erstellung, Audio-Restaurierung) reichen. Die Musikquellentrennung hat eine lange Geschichte wissenschaftlicher Forschung, da sie als äußerst herausforderndes Problem gilt. In den letzten Jahren haben tief neuronale Netzwerke erstmals hochwertige Trennergebnisse erzielt, was auch ein gesteigertes kommerzielles Interesse hervorgerufen hat. Bisher stand jedoch keine quelloffene Implementierung zur Verfügung, die state-of-the-art Ergebnisse erreicht.Open-Unmix schließt diese Lücke, indem es eine Referenzimplementierung auf Basis tiefer neuronalen Netze bereitstellt. Es erfüllt zwei Hauptziele. Erstens beschleunigt Open-Unmix die akademische Forschung, da es Implementierungen für die beliebtesten Frameworks des tiefen Lernens bietet und Forschern so eine flexible Möglichkeit zur Reproduktion von Ergebnissen ermöglicht. Zweitens stellen wir ein vortrainiertes Modell für Endnutzer und sogar Künstler bereit, um die Quellentrennung auszuprobieren und zu nutzen. Darüber hinaus wurde Open-Unmix so konzipiert, dass es eine zentrale Komponente in einem offenen Ökosystem für die Musikquellentrennung bildet, in dem wir bereits offene Datensätze, Software-Tools und offene Evaluierungsverfahren zur Verfügung stellen, um reproduzierbare Forschung als Grundlage zukünftiger Entwicklungen zu fördern.