Le Générateur de Formation de Chambre : Données MIR de Haute Qualité Illimitées grâce au Modèle Génératif

Les données constituent la trame vitale des systèmes d'apprentissage automatique modernes, y compris ceux dédiés à la Retrait d'Information Musicale (RIM). Cependant, la RIM a longtemps été entravée par de petits ensembles de données et des étiquettes peu fiables. Dans cette étude, nous proposons de lever cette contrainte en utilisant la modélisation générative. En chaînant un modèle génératif de notes (Coconet formé sur les Chœurs de Bach) avec un modèle de synthèse structurée d'ensembles de chambre (MIDI-DDSP formé sur URMP), nous présentons un système capable de produire des quantités illimitées de musique chorale réaliste, accompagnées d'annotations riches incluant des mixages, des pistes séparées, des fichiers MIDI, des attributs de performance au niveau des notes (staccato, vibrato, etc.) et même des paramètres de synthèse détaillés (hauteur, amplitude, etc.). Nous appelons ce système le Générateur d'Ensembles de Chambre (GEC) et l'utilisons pour générer un grand ensemble de données composé de chœurs issus de quatre différents ensembles de chambre (CocoChorales). Nous montrons que les données générées par notre approche améliorent les modèles les plus avancés pour la transcription musicale et la séparation des sources, et nous mettons à disposition à la fois le système et l'ensemble de données sous forme open-source pour servir de base aux futures recherches dans la communauté RIM.