Ensemble De Données De Description Vidéo Dense ViTT
Date
il y a 3 ans
URL de publication
Licence
其他
Catégories

ViTT signifie Video Timeline Tags, qui se compose de 8 169 vidéos avec des annotations au niveau des segments générées manuellement. Parmi elles, 5 840 vidéos ont été annotées une fois, et les autres ont été annotées deux fois ou plus. Au total, 12 461 ensembles d’annotations ont été publiés pour cet ensemble de données. Les vidéos de cet ensemble de données proviennent de l'ensemble de données YouTube-8M.