날짜
크기
기관
발행 주소
eric-xw.github.io
라이선스
CC BY 4.0
태그
카테고리
VATEX는 정식 명칭이 Video And TEXt로, 41,250개의 비디오와 825,000개의 중국어 및 영어 자막 세트를 포함하는 대규모 다국어 비디오 설명 데이터 세트입니다. 자막 텍스트에는 206,000개 이상의 영어-중국어 번역 쌍이 있습니다.
이 데이터 세트는 주로 다음 용도로 사용됩니다.
-다국어 비디오 자막 생성
- 비디오 자막 번역