
摘要
在本项工作中,我们展示了如何将一个公开可用的预训练Jukebox模型应用于单通道混合音频中的音频源分离问题。我们提出的神经网络架构采用迁移学习策略,训练过程快速高效,其性能表现与其它需要大量计算资源、训练数据及训练时间的前沿方法相当。我们已将该架构的开源代码实现发布(https://github.com/wzaielamri/unmix),以供学术界和工业界参考与使用。
在本项工作中,我们展示了如何将一个公开可用的预训练Jukebox模型应用于单通道混合音频中的音频源分离问题。我们提出的神经网络架构采用迁移学习策略,训练过程快速高效,其性能表现与其它需要大量计算资源、训练数据及训练时间的前沿方法相当。我们已将该架构的开源代码实现发布(https://github.com/wzaielamri/unmix),以供学术界和工业界参考与使用。