YT-UGC 用户生成内容数据集

YT-UGC 全称 YouTube UGC,是一个大规模的用户生成内容数据集。该数据集包含从 150 万个上传视频中挑选出 1,500 个视频。这些视频被分为 15 个类别,每一个视频都含有不同的分辨率和码率。 每一个视频都有经过主观实验得到的 MOS 分数,对于一些比较流行的类…

LIVE-VQC 视频质量评估数据集

LIVE-VQC 是一个大规模视频质量评估数据集。该数据集涉及几个关键维度:独特内容的数量、采集设备、失真类型和失真组合、研究参与者和记录的主观分数。数据集包含由 80 个不同的用户使用 101 个不同的设备(43 个设备型号)拍摄的 585 个独特内容的视频,以及超过 20.5…

CrossTask 教学视频弱监督学习数据集

CrossTask 是一个研究通过教学视频中的交叉任务,进行弱监督学习的数据集,每个任务 (task) 都提供了一个有序的步骤列表,并附有手动描述 (manual description)。 数据集包含针对 83 项不同任务收集的教学视频,分为两部分: 18 个主要任务:人为收集…

ATD-12K 大规模动画三元组数据集

ATD-12K 是一个大规模动画三元组数据集,其中包含 12,000 个有丰富标注的三元组。其中训练集包含 10,000 个动画帧三元组,测试集包含 2,000 个三元组。该数据集从多元化制片人制作的 30 部系列电影中,共收录 101 个卡通片段,总时长超过 25 小时。采集的…

X4K1000FPS 视频插帧数据集

X4K1000FPS 是一个用于视频插帧的数据集。该数据集的特点是高分辨率(4096 X 2160 像素),高帧率(1000 fps),且具有极端运动情况。 该数据集分成了两部分: X-TEST由 15 个视频片段组成,每个视频片段的序列长度是 33 帧。测试集的选择考虑了遮挡程…

LSMDC 视频描述数据集

LSMDC 全称 Large Scale Movie Description Challenge。该数据集包含了从 202 部电影中提取的 118,081 个短视频片段。每个视频都附有字幕,有的是从电影剧本中提取的,有的是通过 DVS(专为视障人士提供的口述影像服务)转录的。 验…

TVSum 视频摘要数据集

TVSum 全称 Title-based Video Summarization Dataset,是验证视频摘要技术的一个基准。 该数据集包含 50 个不同类型的视频(例如,新闻、操作指南、纪录片、Vlog、自拍),以及 1,000 个通过众包获得的对拍摄高度重要性评分的标注(每…

SumMe 视频摘要数据集

SumMe 是一个视频摘要数据集,由 25 个视频组成,每个视频至少有 15 个人为标注,共有 390 个标注。 数据由视频、标注和评价指标组成。Ground truth是一种新的评价范式,因为它源于心理学实验,可以进行一致的自动评价,不需要在每次获得新摘要结果时都进行用户研究。