VidSitu 视频理解数据集

日期

2 年前

机构

University of Southern California

发布地址

vidsitu.org

许可协议

其他

下载帮助
特色图像

VidSitu 是一个用于视频中语义角色标注任务的数据集 (semantic role labeling in videos, VidSRL) 。 VidSitu 是一个大规模的视频理解数据源,包括 29K 个 10 秒的电影片段,以 2 秒为单位标注了动词和语义角色。实体在片段各事件中被共同引用,事件之间通过事件-事件关系连接起来。

VidSitu 中的片段来自于大量的电影集合 (3K),并选择了复杂(单个视频中 4.2 个独特的动词) 和多样化(200 个动词每个有 100 多个标记)。