FSDnoisy18k 是一个是一个开放的音频数据集。数据集包含共 20 个声音事件类的 42.5 小时音频,包括少量手动标记的数据和大量真实世界的嘈杂数据。音频内容取自 Freesound 。数据集包含 15813 个音频剪辑(38.8 小时)组成的噪声集和由 947 个带有正确标签的音频剪辑(1.4 小时)组成的测试集。该数据集具有两种主要类型的标签噪声:词汇内 (IV) 和词汇外 (OOV) 。
FSDnoisy18k 音频数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 FSDnoisy18k 音频数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 FSDnoisy18k 音频数据集!

相关数据集推荐
CSS10 语音数据集
CSS10 是一个拥有十种语言的单扬声器语音的数据集。数据集包含 LibriVox 有声读物的简短音频剪辑及其校准文本。研究人员根据语音数据集还训练了两个由文本生成语音的神经模型,以验证语音数据集质量。数据集未来可用于演讲任务。

CPED 中文对话数据集
CPED 全称Chinese Personalized and Emotional Dialogue,是第一个大规模的中国个性化和情感对话数据集。数据集由与同理心和个人特征相关的多源知识组成(涵盖了性别、五大个性特征、13 种情感、19 个对话行为和 10 个场景等知识)。 数据…

Music21 音乐视频数据集
Music21 是一个未经修剪的视频数据集,通过关键字从 YouTube 爬取。它包含 21 个类别的音乐表演,数据质量较高,可用于训练和评估视觉声源分离模型 (visual sound source separation model)。
