
摘要
在真实场景录音中进行声音事件检测时,通常需要应对目标声音事件的重叠以及非目标声音(也称为干扰或噪声)的问题。迄今为止,这些问题主要在分类器层面进行处理。本文提出将声音分离作为声音事件检测的预处理步骤。我们以在Free Universal Sound Separation数据集和DCASE 2020任务4的声音事件检测基线数据上训练的声音分离模型为基础,探索了将分离出的声音源与原始混合信号在声音事件检测中进行融合的不同方法。此外,我们还研究了将声音分离模型适配至声音事件检测数据集对声音分离性能以及声音事件检测性能所产生的影响。