Das Kammerensemble-Generator: Unbegrenzte hochwertige MIR-Daten durch generatives Modellieren

Daten sind das Lebensblut moderner maschineller Lernsysteme, einschließlich solcher im Bereich der Musikinformationsrettung (MIR). Allerdings waren MIR-Systeme lange Zeit durch kleine Datensätze und nicht verlässliche Labels behindert. In dieser Arbeit schlagen wir vor, diese Engpasse durch die Verwendung von generativen Modellen zu überwinden. Indem wir ein generatives Modell für Noten (Coconet, trainiert auf Bach-Chorälen) mit einem strukturierten Synthesemodell für Kammerensembles (MIDI-DDSP, trainiert auf URMP) koppeln, zeigen wir ein System, das unbegrenzte Mengen realistischer Choral-Musik mit reichen Anmerkungen erzeugen kann. Diese Anmerkungen umfassen Mischungen, Stämme, MIDI-Daten, notenbezogene Aufführungsattribute (Stakkato, Vibrato usw.) und sogar feingranulare Synthese-Parameter (Tonhöhe, Amplitude usw.). Wir nennen dieses System den Kammerensemble-Generator (CEG) und nutzen es zur Erstellung eines großen Datensatzes von Chorälen aus vier verschiedenen Kammerensembles (CocoChorales). Wir demonstrieren, dass Daten, die mit unserem Ansatz generiert wurden, die Leistung der momentan besten Modelle für Musiktranskription und Quellentrennung verbessert. Beide, das System und der Datensatz, werden als Open-Source-Basis für zukünftige Arbeiten in der MIR-Gemeinschaft freigegeben.