Ensemble De Données De Localisation De Sources Sonores VGG-SS
Date
il y a 3 ans
URL de publication
Licence
其他
Catégories

VGG-SS signifie VGG Sound Source, qui est un ensemble de données vidéo permettant d'évaluer la localisation de la source sonore. L'ensemble de données contient plus de 200 catégories, 5 000 vidéos et de nouvelles annotations de l'ensemble de données VGG-Sound, ce qui le rend 10 fois plus grand que les ensembles de données existants. Les sources sonores visibles dans chaque clip vidéo sont clairement étiquetées avec des cadres de délimitation. Contrairement à Flickr SoundNet, la localisation de la source sonore dans cet ensemble de données est basée sur des vidéos.