日期
机构
发布地址
www.robots.ox.ac.uk
许可协议
其他
标签
国外高校
声源定位
分类
VGG-SS 全称 VGG Sound Source,是关于评估声源定位的视频数据集。该数据集包含 200 多个类别、 5000 个视频以及 VGG-Sound 数据集的新标注,比现有数据集大 10 倍。每个视频片段中的可见声源都被边界框明确标注。与 Flickr SoundNet 不同,该数据集的声源定位是基于视频的。