日期
机构
发布地址
www.robots.ox.ac.uk
许可协议
其他
标签
外国の大学
音源定位
分类
VGG-SSはVGG Sound Sourceの正式名称であり、音源定位を評価するためのビデオデータセットです。このデータセットには、200 を超えるカテゴリ、5000 のビデオ、および VGG-Sound データセットの新しい注釈が含まれており、既存のデータセットの 10 倍の大きさです。各ビデオ クリップ内の可視音源は、境界ボックスで明確にラベル付けされています。 Flickr SoundNet とは異なり、このデータセットの音源定位はビデオベースです。