2 个月前

WildDESED:用于野生家庭环境声音事件检测系统的LLM驱动数据集

Xiao, Yang ; Das, Rohan Kumar
WildDESED:用于野生家庭环境声音事件检测系统的LLM驱动数据集
摘要

本研究旨在通过引入一个新的大型语言模型(LLM)驱动的数据集——野生家庭环境声音事件检测数据集(WildDESED),来推进声音事件检测(SED)的研究。该数据集是在原始DESED数据集的基础上扩展而成,旨在反映家庭环境中多样的声学变化和复杂的噪声。我们利用大型语言模型生成了基于DESED数据集中目标声音类别的八种不同的家庭场景。随后,我们从AudioSet中精心挑选了一组噪声并将其混合到这些场景中,确保这些噪声与目标声音没有重叠。为了研究WildDESED数据集的挑战性,我们采用了广泛流行的卷积神经递归网络(CNN-RNN)。接着,我们通过逐步增加噪声复杂度的方法应用了课程学习,以增强模型在不同噪声水平下的泛化能力。实验结果表明,这种方法在嘈杂环境下取得了改进,验证了其在WildDESED数据集上的有效性,并促进了对噪声鲁棒性的SED技术的发展。

WildDESED:用于野生家庭环境声音事件检测系统的LLM驱动数据集 | 最新论文 | HyperAI超神经