
摘要
本文探讨了使用深度神经网络对复调音乐进行序列建模的方法。尽管近期的研究突破主要集中在网络架构上,我们证明了序列表示同样可以对模型性能产生重大影响,这可以通过验证集损失来衡量。通过提取训练数据集中固有的显著特征,模型可以基于这些特征进行条件化处理,或者被训练预测这些特征作为所建模序列的额外组成部分。我们展示了训练神经网络预测一个看似更为复杂的序列(包含额外特征)可以显著提升整体模型性能。首先,我们介绍了TonicNet,这是一种基于门控循环单元(GRU)的模型,其训练目标是在给定时间步长上先预测和弦,然后再预测该时间步长上每个声部的音符,而传统的做法通常是仅预测音符。随后,我们在经典的JSB Chorales数据集上评估了TonicNet,并获得了最先进的结果。