HyperAI

VGG-SS-Datensatz Zur Schallquellenlokalisierung

Datum

vor 3 Jahren

Organisation

Universität Oxford

Veröffentlichungs-URL

www.robots.ox.ac.uk

Lizenz

其他

Download-Hilfe
特色图像

VGG-SS steht für VGG Sound Source, ein Videodatensatz zur Auswertung der Schallquellenlokalisierung. Der Datensatz enthält mehr als 200 Kategorien, 5.000 Videos und neue Anmerkungen des VGG-Sound-Datensatzes und ist damit zehnmal größer als vorhandene Datensätze. Sichtbare Tonquellen in jedem Videoclip sind deutlich mit Begrenzungsrahmen gekennzeichnet. Anders als bei Flickr SoundNet basiert die Lokalisierung der Tonquelle in diesem Datensatz auf Videos.