Meta-Lernende Extraktoren für die Musikquellentrennung

Wir schlagen ein hierarchisches, meta-learning-inspiriertes Modell für die Musikquellentrennung (Meta-TasNet) vor, bei dem ein Generatormodell zur Vorhersage der Gewichte einzelner Extraktormodelle verwendet wird. Dies ermöglicht eine effiziente Parameterverteilung, während dennoch eine instrumentenspezifische Parametrisierung erhalten bleibt. Meta-TasNet zeigt sich als wirksamer als Modelle, die unabhängig oder in einem Multi-Task-Setting trainiert wurden, und erreicht eine Leistung, die mit den aktuell besten Methoden vergleichbar ist. Im Vergleich zu diesen erreichen unsere Extraktoren weniger Parameter und weisen eine schnellere Laufzeitleistung auf. Wir diskutieren wichtige architektonische Überlegungen und untersuchen die Kosten und Vorteile dieses Ansatzes.