DCASE 2013 全称 Detection and Classification of Acoustic Scenes and Events,是一个用于声音事件检测的数据集。该数据集由纯音频录音组成,其特征是单个声音事件在一个声学场景中很突出。
在场景分类任务的数据集中,每种声场由 30 秒录音组成。数据集将由 2 个部分组成,每个部分由每个场景(类)的 6 个音频记录组成。场景列表包括 10 个类别:繁忙的街道,安静的街道,公园,露天市场,公共汽车,地铁列车,餐厅,商店/超市,办公室,地铁站 。