Mehrsprachiger How2-Videodatensatz
Datum
vor 3 Jahren
Veröffentlichungs-URL
Lizenz
CC BY-SA 4.0
Kategorien

Dies ist ein mehrsprachiger Videodatensatz mit 13.500 Videos und 300 Stunden Reden, alle mit englischen Untertiteln und portugiesischen Übersetzungen. Davon werden 185.187 Korpora für das Training, 2.022 Korpora für die Entwicklung (Dev) und 2.361 Korpora für Tests verwendet. Dieser Datensatz kann zum Studium des multimodalen Sprachverständnisses verwendet werden.