JS Fake Chorales : un jeu de données synthétique de musique polyphonique avec annotation humaine

Les jeux de données de haute qualité destinés à la modélisation fondée sur l’apprentissage de la musique symbolique polyphonique restent moins facilement accessibles à grande échelle que dans d’autres domaines, tels que la modélisation du langage ou la classification d’images. Les algorithmes d’apprentissage profond montrent un potentiel considérable pour permettre une utilisation généralisée de la technologie interactive de génération musicale dans les applications grand public, mais le manque de jeux de données à grande échelle constitue un goulot d’étranglement pour le développement d’algorithmes capables de produire de manière cohérente des sorties de haute qualité. Nous proposons que des modèles aux compétences étroites puissent servir de source de données synthétiques de haute qualité et évolutives, et mettons gratuitement à disposition le jeu de données JS Fake Chorales, composé de 500 pièces générées par un nouvel algorithme fondé sur l’apprentissage, sous forme MIDI. Nous utilisons des séquences consécutives de sorties issues de l’algorithme, sans sélection arbitraire, afin de valider le potentiel d’extension à la demande de ce jeu de données. Nous menons une expérience en ligne d’évaluation humaine, conçue pour être aussi équitable que possible pour l’auditeur, et constatons que les participants distinguent les pièces du JS Fake Chorales des chœurs réels composés par J.S. Bach, en moyenne, seulement 7 % mieux que le hasard. En outre, nous mettons à disposition, conjointement aux échantillons MIDI, les données anonymisées collectées lors des expériences. Enfin, nous réalisons des études d’ablation pour démontrer l’efficacité de l’utilisation des pièces synthétiques dans la recherche sur la modélisation de la musique polyphonique, et constatons que l’on peut améliorer, en utilisant un algorithme connu, la perte sur l’ensemble de validation de l’ensemble canonique JSB Chorales, simplement en enrichissant l’ensemble d’entraînement avec les pièces du JS Fake Chorales.