VGG-SS-Datensatz Zur Schallquellenlokalisierung
Datum
vor 3 Jahren
Veröffentlichungs-URL
Lizenz
其他
Kategorien

VGG-SS steht für VGG Sound Source, ein Videodatensatz zur Auswertung der Schallquellenlokalisierung. Der Datensatz enthält mehr als 200 Kategorien, 5.000 Videos und neue Anmerkungen des VGG-Sound-Datensatzes und ist damit zehnmal größer als vorhandene Datensätze. Sichtbare Tonquellen in jedem Videoclip sind deutlich mit Begrenzungsrahmen gekennzeichnet. Anders als bei Flickr SoundNet basiert die Lokalisierung der Tonquelle in diesem Datensatz auf Videos.