VidSTG 数据集是一个基于 VidOR 数据集构建的时空视频接地数据集。VidOR 是一个视频关系数据集,包含 7,000、835 和 2,165 个视频,分别用于训练、验证和测试。时空视频接地(Spatio-Temporal Video Grounding task)任务的目标是定位未剪辑视频的时空部分,该部分与描述目标的给定句子相匹配。
VidSTG 大规模视频接地数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 VidSTG 大规模视频接地数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 VidSTG 大规模视频接地数据集!

相关数据集推荐
UTD-MHAD 人体动作识别数据集
UTD 全称 University of Texas at Dallas,MHAD 全称 Multimodal Human Action Dataset。这个数据集由 8 名受试者 27 个动作的视频组成。每个受试者重复一个动作 4 次,总共产生 861 个动作序列(有 3 个动…

HACS 人体动作识别数据集
HACS 全称 Human Action Clips and Segments,是一个用于人体动作识别的视频数据集。 该数据集包含 200 个动作类别,与 ActivityNet-v1.3 数据集的分类相同。视频来源于 YouTube,大小为 504K,每个视频时长少于 4 分钟…

MSR Action Pairs 3D 动作识别数据集
MSR Action Pairs 是一个 3D 动作识别数据集。该数据集中的动作是成对的,使得每对动作中的两个动作在运动(有类似的轨迹)和形状(有类似的对象)上是相似的;但是,运动-形状关系是不同的。
