VidSTG 大规模视频接地数据集

该数据集暂无下载资源提供,我们正在积极的准备提供更多的数据集

VidSTG 数据集是一个基于 VidOR 数据集构建的时空视频接地数据集。VidOR 是一个视频关系数据集,包含 7,000、835 和 2,165 个视频,分别用于训练、验证和测试。时空视频接地(Spatio-Temporal Video Grounding task)任务的目标是定位未剪辑视频的时空部分,该部分与描述目标的给定句子相匹配。