日期
机构
发布地址
github.com
许可协议
其他
标签
时序动作定位
时态动作定位
视频接地
分类
视频字幕
VidSTG 数据集是一个基于 VidOR 数据集构建的时空视频接地数据集。 VidOR 是一个视频关系数据集,包含 7,000 、 835 和 2,165 个视频,分别用于训练、验证和测试。时空视频接地(Spatio-Temporal Video Grounding task)任务的目标是定位未剪辑视频的时空部分,该部分与描述目标的给定句子相匹配。