HyperAI

ViTT Dense Videobeschreibungsdatensatz

Datum

vor 3 Jahren

Organisation

Veröffentlichungs-URL

github.com

Lizenz

其他

Kategorien

Download-Hilfe
特色图像

ViTT steht für Video Timeline Tags und besteht aus 8.169 Videos mit manuell generierten Anmerkungen auf Segmentebene. Davon wurden 5.840 Videos einfach und der Rest zweimal oder öfter kommentiert. Für diesen Datensatz wurden insgesamt 12.461 Anmerkungssätze veröffentlicht. Die Videos in diesem Datensatz stammen aus dem Youtube-8M-Datensatz.