MSR-VTT-Videountertitel-Datensatz
Datum
Größe
Veröffentlichungs-URL
Paper-URL
Lizenz
Andere
Tags

MSR-VTT, der vollständige Name von Microsoft Research Video to Text, ist ein umfangreicher Datensatz zur Videountertitelung für offene Domänen.
Der Datensatz besteht aus 10.000 Videoclips aus 20 Kategorien, jeder mit 20 englischen Sätzen, die von Amazon Mechanical Turks kommentiert wurden. Alle Untertitel enthalten ungefähr 29.000 verschiedene Wörter. Die Standardsegmentierung verwendet 6.513 Segmente für das Training, 497 Segmente für die Validierung und 2.990 Segmente für das Testen.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.