VATEX 视频字幕数据集

VATEX 全称 Video And TEXt,是一个大型多语言视频描述数据集,包括了 41,250 部视频以及 825,000  组中英文字幕。字幕文本中,有超过 206,000 组英汉对应翻译对。 该数据集主要用于: -多语言视频字幕生成 -视频字幕翻译