How2 多语言视频数据集

本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)

这是一个关于多语言视频数据集,包含 13,500 个视频,300 小时演讲,视频均带有英文字幕和的葡萄牙语翻译。其中 185,187 个语料用于训练、2,022 个语料用于开发(dev)、2,361 个语料用于测试。该数据集可用于研究多模态语言理解。