HyperAI초신경

VATEX 비디오 자막 데이터 세트

날짜

3년 전

크기

4.31 GB

기관

캘리포니아 대학교 산타바바라

발행 주소

eric-xw.github.io

라이선스

CC BY 4.0

카테고리

特色图像

VATEX는 정식 명칭이 Video And TEXt로, 41,250개의 비디오와 825,000개의 중국어 및 영어 자막 세트를 포함하는 대규모 다국어 비디오 설명 데이터 세트입니다. 자막 텍스트에는 206,000개 이상의 영어-중국어 번역 쌍이 있습니다.

이 데이터 세트는 주로 다음 용도로 사용됩니다.

-다국어 비디오 자막 생성

- 비디오 자막 번역

VATEX.torrent
시딩 1다운로드 중 1완료됨 554총 다운로드 횟수 1,090
  • VATEX/
    • README.md
      1.11 KB
    • README.txt
      2.22 KB
      • data/
        • private_test.zip
          665.06 MB
        • public_test.zip
          1.27 GB
        • trainval.zip
          4.24 GB
        • vatex_private_test_without_annotations.json
          4.24 GB
        • vatex_public_test_english_v1.1.json
          4.25 GB
        • vatex_training_v1.0.json
          4.3 GB
        • vatex_validation_v1.0.json
          4.31 GB