HyperAI초신경

VGG-SS 음원 위치 추정 데이터 세트

날짜

3년 전

기관

옥스퍼드 대학교

발행 주소

www.robots.ox.ac.uk

라이선스

其他

카테고리

다운로드 도움말
特色图像

VGG-SS는 VGG Sound Source의 약자로, 음원 위치 추정을 평가하기 위한 비디오 데이터 세트입니다. 이 데이터 세트에는 200개 이상의 카테고리, 5,000개의 비디오, VGG-Sound 데이터 세트의 새로운 주석이 포함되어 있어 기존 데이터 세트보다 10배 더 큽니다. 각 비디오 클립의 눈에 보이는 사운드 소스는 경계 상자로 명확하게 표시됩니다. Flickr SoundNet과 달리 이 데이터 세트의 사운드 소스 현지화는 비디오를 기반으로 합니다.