HyperAIHyperAI

ViTT Dense Videobeschreibungsdatensatz

Datum

vor 3 Jahren

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Lizenz

其他

Download-Hilfe
特色图像

ViTT steht für Video Timeline Tags und besteht aus 8.169 Videos mit manuell generierten Anmerkungen auf Segmentebene. Davon wurden 5.840 Videos einfach und der Rest zweimal oder öfter kommentiert. Für diesen Datensatz wurden insgesamt 12.461 Anmerkungssätze veröffentlicht. Die Videos in diesem Datensatz stammen aus dem Youtube-8M-Datensatz.

ViTT Dense Videobeschreibungsdatensatz | Datensätze | HyperAI