日期
大小
机构
发布地址
eric-xw.github.io
许可协议
CC BY 4.0
标签
分类
VATEX 全称 Video And TEXt,是一个大型多语言视频描述数据集,包括了 41,250 部视频以及 825,000 组中英文字幕。字幕文本中,有超过 206,000 组英汉对应翻译对。
该数据集主要用于:
-多语言视频字幕生成
-视频字幕翻译