17 天前

Open-Unmix - 音乐源分离的参考实现

{and YukiMitsufuji, Fabian-Robert Stöter, Stefan Uhlich, Antoine Liutkus}
Open-Unmix - 音乐源分离的参考实现
摘要

音乐源分离是指将音乐信号分解为其组成部分的任务,例如分离出人声、贝斯和鼓等独立音轨。这种分离技术具有广泛的应用场景,包括对音轨进行重新编排或再利用(如混音、重配乐、升混),以及实现完整的音源提取(如卡拉OK制作、音频采样生成、音频修复等)。音乐分离问题自科学界研究以来已有较长历史,因其极高的技术难度而广为人知。近年来,基于深度学习的系统首次实现了高质量的分离效果,从而引发了业界的广泛关注与商业兴趣。然而,迄今为止,尚无开源实现能够达到当前最先进的性能水平。Open-Unmix 正是为填补这一空白而设计,它基于深度神经网络提供了一个参考实现。该系统主要服务于两大目标:其一,加速学术研究进程。Open-Unmix 支持目前最流行的深度学习框架,使研究人员能够灵活复现研究成果,提升实验效率;其二,我们为普通用户乃至音乐创作者提供了预训练模型,便于其直接尝试并应用音源分离技术。此外,Open-Unmix 的设计定位为开放音乐分离生态系统的核心组件,我们已同步提供开放数据集、软件工具和开放评估机制,旨在推动可复现的研究,为未来技术发展奠定坚实基础。