HyperAI

Ensemble De Données De Description Vidéo Dense ViTT

Date

il y a 3 ans

Organisation

URL de publication

github.com

Licence

其他

Aide au téléchargement
特色图像

ViTT signifie Video Timeline Tags, qui se compose de 8 169 vidéos avec des annotations au niveau des segments générées manuellement. Parmi elles, 5 840 vidéos ont été annotées une fois, et les autres ont été annotées deux fois ou plus. Au total, 12 461 ensembles d’annotations ont été publiés pour cet ensemble de données. Les vidéos de cet ensemble de données proviennent de l'ensemble de données YouTube-8M.