VATEX 全称 Video And TEXt,是一个大型多语言视频描述数据集,包括了 41,250 部视频以及 825,000 组中英文字幕。字幕文本中,有超过 206,000 组英汉对应翻译对。
该数据集主要用于:
-多语言视频字幕生成
-视频字幕翻译
2 做种
0 下载
275 已完成
- VATEX/README.md 1.11 KB
- VATEX/README.txt 1.11 KB
- VATEX/data/private_test.zip 665.06 MB
- VATEX/data/public_test.zip 634.9 MB
- VATEX/data/trainval.zip 2.97 GB
- VATEX/data/vatex_private_test_without_annotations.json 257.5 KB
- VATEX/data/vatex_public_test_english_v1.1.json 4.71 MB
- VATEX/data/vatex_training_v1.0.json 54.66 MB
- VATEX/data/vatex_validation_v1.0.json 6.29 MB