TVQA 视频问答数据集

日期

2 年前

机构

发布地址

tvqa.cs.unc.edu

许可协议

其他

下载帮助
特色图像

TVQA 数据集是一个大规模的视频问答数据集,视频来源于 6 部经典美剧。该数据集包含约 152.5K 个问答对,这些问答对来自 21.8K 个时长为 60-90 秒的视频片段,总长度超过 460 个小时。这些问答对以 8:1:1 的比例用于训练、验证和测试集。

TVQA 数据集的问题采用了组合式的设计,包含问答 (Question) 和定位 (Localization) 两个部分,并且每个问题都带有时序定位。回答这样的问题需要模型具有一定的时序定位 (temporal localization),理解对话 (subtitle) 和视频 (video) 的能力。