VGG-SS 声源定位数据集

日期

2 年前

机构

University of Oxford

许可协议

其他

下载帮助
特色图像

VGG-SS 全称 VGG Sound Source,是关于评估声源定位的视频数据集。该数据集包含 200 多个类别、 5000 个视频以及 VGG-Sound 数据集的新标注,比现有数据集大 10 倍。每个视频片段中的可见声源都被边界框明确标注。与 Flickr SoundNet 不同,该数据集的声源定位是基于视频的。