How2 多语言视频数据集

日期

2 年前

机构

发布地址

srvk.github.io

许可协议

CC BY-SA 4.0

下载帮助
特色图像

这是一个关于多语言视频数据集,包含 13,500 个视频,300 小时演讲,视频均带有英文字幕和的葡萄牙语翻译。其中 185,187 个语料用于训练、 2,022 个语料用于开发(dev)、 2,361 个语料用于测试。该数据集可用于研究多模态语言理解。