VidSTG 大规模视频接地数据集

日期

2 年前

机构

Zhejiang University

发布地址

github.com

许可协议

其他

下载帮助
特色图像

VidSTG 数据集是一个基于 VidOR 数据集构建的时空视频接地数据集。 VidOR 是一个视频关系数据集,包含 7,000 、 835 和 2,165 个视频,分别用于训练、验证和测试。时空视频接地(Spatio-Temporal Video Grounding task)任务的目标是定位未剪辑视频的时空部分,该部分与描述目标的给定句子相匹配。