MUSDB18-HQ 音乐分轨数据集 

MUSDB18-HQ 是 MUSDB18 数据集的高质量版本。该数据集由 150 首不同风格的全音轨歌曲组成,包括混合立体声和原始音源,分为训练子集和测试子集。其目的是为源分离算法的设计和评估提供参考数据库。歌曲以原始 WAV 文件的形式提供。

URMP 音乐表演视听分析数据集

URMP 全称 University of Rochester Multi-Modal Musical Performance,是一个用于音乐表演视听分析的数据集。该数据集包括 44 首简单的多乐器音乐作品,由单个曲目单独录制的表演成。对于每首作品,数据集都提供了 MIDI 格式…

UrbanSound8K 音频分类数据集

UrbanSound8K 是一个音频数据集,包含 8,732 个带标注的城市声音片段(≤4 秒)。该数据集包含 27 个小时的音频,其中有 18.5 个小时的音频带有事件发生的标注。 这些音频涉及 10 个类别:空调、汽车喇叭、儿童游戏、狗叫、钻孔、引擎声、枪声、手锤声、汽笛声和…

FSDKaggle2018 音频分类数据集

FSDKaggle2018 是一个音频数据集,可用于音频标注、声源分离等任务。该数据集包含 11,073 个音频文件,并通过 AudioSet Ontology 的 41 个类别进行标注。 该数据集已被用于 DCASE Challenge 2018 Task 2。所有的音频样本都…

TUT Acoustic Scenes 2017 声音场景识别数据集

TUT Acoustic Scenes 2017 包含一组来自不同声学场景的录音,均来自不同的地点。每个录音地点都包括 3-5 分钟的录音,并被分割成 10 秒音频片段,作为这项任务的采样单位。所有的音频片段都以 44.1 khz 的采样率和 24 比特的分辨率记录。

DCASE 2013 声音事件检测数据集

DCASE 2013 全称 Detection and Classification of Acoustic Scenes and Events,是一个用于声音事件检测的数据集。该数据集由纯音频录音组成,其特征是单个声音事件在一个声学场景中很突出。 在场景分类任务的数据集中,每种…

POP909 音乐数据集

POP909 数据集包含由专业音乐家创作的 909 首流行歌曲的钢琴编曲的多个版本。 该数据集的主体包含 MIDI 格式的每首歌曲的人声旋律、主音乐器旋律和钢琴伴奏,这些歌曲与原始音频文件对齐。此外,该数据集还提供了速度,节拍,键和和弦的标注,其中速度曲线是手工标注的,其他的由 …

ESC-50 环境声音分类数据集

ESC-50 数据集是 2000 个环境声音记录的标注集合,用于进行环境声音分类的研究。该数据集主要包括 2000 个长达 5 秒的录音,录音可分为动物、自然、人类、户内、户外共 5 类。