2 个月前

ByteCover3:基于短查询的精确翻唱歌曲识别

Xingjian Du; Zijie Wang; Xia Liang; Huidong Liang; Bilei Zhu; Zejun Ma
ByteCover3:基于短查询的精确翻唱歌曲识别
摘要

基于深度学习的方法近年来已成为封面歌曲识别(CSI)的范式,其中ByteCover系统在所有主流CSI数据集上均取得了最先进的结果。然而,随着短视频的兴起,许多实际应用需要将短音乐片段与数据库中的全长音乐曲目进行匹配,这一领域仍处于探索阶段,亟待工业级解决方案的出现。本文中,我们将之前的ByteCover系统升级为ByteCover3,该系统利用局部特征进一步提升了对短音乐查询的识别性能。ByteCover3设计了局部对齐损失(Local Alignment Loss, LAL)模块和两阶段特征检索管道,使得系统能够以更高的精度和效率执行CSI任务。我们使用多个不同基准设置的数据集对ByteCover3进行了评估,在这些评估中,ByteCover3超越了所有被比较的方法,包括其早期版本。