HyperAI
Command Palette
Search for a command to run...
VGG-SS 声源定位数据集

VGG-SS 全称 VGG Sound Source,是关于评估声源定位的视频数据集。该数据集包含 200 多个类别、 5000 个视频以及 VGG-Sound 数据集的新标注,比现有数据集大 10 倍。每个视频片段中的可见声源都被边界框明确标注。与 Flickr SoundNet 不同,该数据集的声源定位是基于视频的。
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。