VGG-SS音源定位データセット

日期

2 年前

机构

オックスフォード大学

许可协议

其他

下载帮助
特色图像

VGG-SSはVGG Sound Sourceの正式名称であり、音源定位を評価するためのビデオデータセットです。このデータセットには、200 を超えるカテゴリ、5000 のビデオ、および VGG-Sound データセットの新しい注釈が含まれており、既存のデータセットの 10 倍の大きさです。各ビデオ クリップ内の可視音源は、境界ボックスで明確にラベル付けされています。 Flickr SoundNet とは異なり、このデータセットの音源定位はビデオベースです。