16 天前

JS Fake Chorales:一个带有人工标注的复调音乐合成数据集

JS Fake Chorales:一个带有人工标注的复调音乐合成数据集
摘要

基于学习的复调记谱音乐建模所需高质量数据集的可获取性,目前仍远不及语言建模或图像分类等领域。深度学习算法在推动交互式音乐生成技术在消费级应用中的广泛应用方面展现出巨大潜力,但大规模高质量数据集的缺乏,仍是制约生成算法持续产出高质量结果的关键瓶颈。我们提出,具备特定专长的模型可作为高质量、可扩展合成数据的来源。为此,我们开源了“JS Fake Chorales”数据集——该数据集包含由一种新型学习算法生成的500首乐曲,以MIDI格式提供。我们采用算法连续输出的乐曲片段,避免人为挑选样本,以验证该数据集按需扩展的可行性。我们开展了一项在线人类评估实验,力求对听者尽可能公平,结果表明,参与者在区分“JS Fake Chorales”与巴赫(JS Bach)创作的真实赋格作品时,平均仅比随机猜测高出7%。此外,我们还公开了实验过程中收集的匿名化数据,与MIDI样本一同提供。最后,我们通过消融实验验证了该合成乐曲在复调音乐建模研究中的有效性,结果表明,仅通过将“JS Fake Chorales”数据加入已知算法的训练集,即可在经典JSB Chorales数据集上实现对当前最优模型验证集损失的改进。

JS Fake Chorales:一个带有人工标注的复调音乐合成数据集 | 最新论文 | HyperAI超神经