VGG-SS 음원 위치 추정 데이터 세트

VGG-SS는 VGG Sound Source의 약자로, 음원 위치 추정을 평가하기 위한 비디오 데이터 세트입니다. 이 데이터 세트에는 200개 이상의 카테고리, 5,000개의 비디오, VGG-Sound 데이터 세트의 새로운 주석이 포함되어 있어 기존 데이터 세트보다 10배 더 큽니다. 각 비디오 클립의 눈에 보이는 사운드 소스는 경계 상자로 명확하게 표시됩니다. Flickr SoundNet과 달리 이 데이터 세트의 사운드 소스 현지화는 비디오를 기반으로 합니다.