VidSTG 大规模视频接地数据集

本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)

VidSTG 数据集是一个基于 VidOR 数据集构建的时空视频接地数据集。VidOR 是一个视频关系数据集,包含 7,000、835 和 2,165 个视频,分别用于训练、验证和测试。时空视频接地(Spatio-Temporal Video Grounding task)任务的目标是定位未剪辑视频的时空部分,该部分与描述目标的给定句子相匹配。