DroneCrowd 无人机视频数据集

DroneCrowd 是一个新的无人机捕获的大规模数据集,可用于解决无人机拍摄的拥挤场景中的密度图估计、定位和跟踪任务。该数据集由 112 个视频剪辑和 33,600 个高清帧组成。值得注意的是,该数据集用 480 万个 head 和几个视频级属性来标注了 20,800 人的轨迹…

TUM monoVO 远程跟踪数据集

TUM monoVO 数据集可用于评估单目视觉里程(monocular Visual Odometry)和 SLAM 的跟踪精度。该数据集提供了从室内到室外的各种场景中的 50 个序列。 室内场景主要记录在一栋教学楼内,涵盖办公室、走廊、大厅等。室外场景主要记录在校园区域,包括建…

TrajNet 轨迹预测数据集

TrajNet 是基于轨迹的大规模活动基准,提供用于测试方法的统一评估系统。该挑战包括预测 3,161 条人类轨迹,基于世界平面坐标为每条轨迹观察 8 个连续的 ground truth 值(3.2秒),即 t-7, t-6, …, t,并预测随后的12个轨迹(4.8 秒),即t…

HiEve 视频分析数据集

HiEve 全称 Human-in-Events,旨在用于理解各种现实事件中,特别是人群和复杂事件(包括地铁上下车,碰撞,战斗和地震逃生)中的人类动作、姿势和动作。HiEve 对于以人为中心的视频分析是一个具有挑战性的数据集。 该数据集包括当前最大的姿势数(> 1M),最大数量的…

UAVDT 无人机目标检测追踪视频数据集

UAVDT 全称 Unmanned Aerial Vehicle Benchmark Object Detection and Tracking,是关于无人机目标检测追踪的大规模视频数据集,包含 10 小时的原始视频,约 8,000 具有代表性的视频帧,这些视频帧带有手动标注边界…

CUHK-SYSU 人员搜索数据集

CUHK-SYSU 全称 CUHK-SYSU Person Search Dataset,是一个大规模的人员搜索基准,包含 8,432 个人共计 18,184 张图像。 根据图像来源,数据集可以分为两部分: 街拍:图像通过手持摄像机收集,跨越数百个场景,并尝试包括视角、光线、分辨…

MARS 行人重识别视频数据集

MARS 全称 Motion Analysis and Re-identification Set,是一个大规模的行人重识别视频数据集,也是 Market-1501 数据集的扩充。 数据是由六个近乎同步的摄像机收集的。数据集包含 1,261 个不同的行人,每人至少被 2 个摄像机…

Foggy Cityscapes 合成雾景数据集

Foggy Cityscapes 是一个合成的雾景图像数据集。该数据集中的每张雾景图像都是用 Cityscapes 数据集中的清晰图像和深度图渲染的,总共包含 20,550 张图像。 因为 Foggy Cityscapes 数据集的每张图像都是在 Cityscapes …

TrackingNet 大规模户外目标跟踪数据集

TrackingNet 是一个大规模的目标跟踪数据集,由户外视频组成。该数据集包含 30,643 个视频片段,分为 30,132 个训练视频和 511 个测试视频,平均每个视频有 470,9 帧。 该数据集提供超过 1400 万个密集的边界框标注,涵盖了户外场景下的各种情形,包含…

OTB-2013 视觉跟踪数据集

OTB2013 是目前 OTB2015 视觉追踪基准的早期版本。OTB2013 数据集仅包含 50 个跟踪序列,而目前版本 OTB2015 的基准是 100 个序列。 同时作者还提出了一系列的评估准则。该数据集及评价标准为跟踪算法提供了统一的测试与评估环境,极大地促进了早期视觉跟…

Head Tracking 21  头部追踪数据集

CroHD 全称 Crowd of Heads Dataset,是一个可用于头部追踪任务的数据集。该数据集由 9 个高清分辨率序列中的 11,463 帧组成,其中有超过 2,276,838 个头部和 5,230 条轨迹,并在不同的场景中进行了标注。 CroHD 中所有序列的帧速率…

VOT2017 目标跟踪数据集

VOT2017 是被用于 2017 年 VOT 挑战 (The Visual Object Tracking challenge)的数据集。该数据集可用于不同任务的目标跟踪,包含 60 个用 6 个不同属性标注的短序列。 VOT 挑战由 Open Challenges 组织,旨在…

TrackNet 网球追踪数据集

TrackNet 是一个用于识别体育运动中网球运动的数据集。 第一个数据集基于 2017 年夏季世界大学生运动会网球男单决赛的转播视频。分辨率、帧率和视频长度分别为 1280×720、30 fps和 75 分钟。删减后得到 81 个比赛相关的视频片段,每个片段都记录了从开始发球到…

MOT17 多目标跟踪数据集

MOT17 全称为 Multiple Object Tracking 17,是一个可用于多目标跟踪的数据集。与前一版本 MOT16 类似,该数据集中的挑战包括七个带有行人的室内外公共场所场景。每个场景的视频被分为两个片段,分别用于训练和测试。 该数据集通过 SDP、Faster-…