HyperAI

VATEX-Datensatz Für Videountertitel

Datum

vor 3 Jahren

Größe

4.31 GB

Organisation

Universität von Kalifornien, Santa Barbara

Veröffentlichungs-URL

eric-xw.github.io

Lizenz

CC BY 4.0

特色图像

VATEX, dessen vollständiger Name „Video And TEXt“ lautet, ist ein großer mehrsprachiger Datensatz mit Videobeschreibungen, der 41.250 Videos und 825.000 Sätze mit chinesischen und englischen Untertiteln enthält. Der Untertiteltext enthält mehr als 206.000 englisch-chinesische Übersetzungspaare.

Dieser Datensatz wird hauptsächlich verwendet für:

-Generierung mehrsprachiger Videountertitel

- Übersetzung von Videountertiteln

VATEX.torrent
Seeding 1Herunterladen 1Abgeschlossen 554Gesamtdownloads 1,090
  • VATEX/
    • README.md
      1.11 KB
    • README.txt
      2.22 KB
      • data/
        • private_test.zip
          665.06 MB
        • public_test.zip
          1.27 GB
        • trainval.zip
          4.24 GB
        • vatex_private_test_without_annotations.json
          4.24 GB
        • vatex_public_test_english_v1.1.json
          4.25 GB
        • vatex_training_v1.0.json
          4.3 GB
        • vatex_validation_v1.0.json
          4.31 GB