HyperAI

Mehrsprachiger How2-Videodatensatz

Datum

vor 3 Jahren

Organisation

Veröffentlichungs-URL

srvk.github.io

Lizenz

CC BY-SA 4.0

Download-Hilfe
特色图像

Dies ist ein mehrsprachiger Videodatensatz mit 13.500 Videos und 300 Stunden Reden, alle mit englischen Untertiteln und portugiesischen Übersetzungen. Davon werden 185.187 Korpora für das Training, 2.022 Korpora für die Entwicklung (Dev) und 2.361 Korpora für Tests verwendet. Dieser Datensatz kann zum Studium des multimodalen Sprachverständnisses verwendet werden.