PoseTrack 多人视频姿态估计数据集

PoseTrack 是人类姿势估计和视频中的清晰跟踪的大规模基准,我们提供公开的培训和验证集以及评估服务器,用于对保留的测试集进行基准测试。 该数据集也是「ICCV 17」和「ECCV 18」研讨会挑战赛的基础。

MPII Human Shape 人体模型数据集

MPII Human Shape 是一个人体模型数据集,包括一系列人体轮廓和形状的 3D 模型及工具,其中训练模型从平面扫描数据库 CAESAR 学习得到。 MPII 人体形态是一组三维人体形态模型和工具,用于人体形态空间的构建、操作和评价,人体形状空间基于统计身体表示学习从凯撒…

KITTI-360 自动驾驶数据集

KITTI-360 是一个具有丰富感知信息 (sensory information) 和完整标注的大规模数据集。它包括在 73.7 公里的行驶距离内,产生的 32 万张图像和 10 万个激光扫描文件。 在 KITTI 数据集基础上,KITTI-360 提供了更全面的 2D 及 …

AGORA 姿态估计数据集

AGORA 全称 Avatars in Geography Optimized for Regression Analysis,是一个合成人类数据集,具有高真实度和非常准确的 ground truth。此数据集包括约 14k 张训练图像和 3k 张测试图像,使用基于图像的ligh…

MPII 人体姿势估计数据集

MPII 是用于评估人体姿势估计的数据集以及相关基准,拥有约 2.5 万张图像并且包含超过 4 万名具有注释关节的人,该数据集利用人类活动的既定分类法系统化收集图像。 总体来看,该数据集涵盖 410 种人类行为且每个图像都提供活动标签,每张图片均来自 YouTube 视频,并提供…

Cityscapes 立体视频数据集

Cityscapes 数据集包含 50 个不同城市街景中记录的视频序列,其中包含 20000 个弱注释帧和 5000 帧的高质量像素级注释。 该数据集专注于对城市街景的语义理解,旨在将评估视觉算法用于语义城市场景理解中,该数据集的应用有以下两点: 像素级和实例级语义标签;&nbs…

KITTI 计算机视觉算法评测数据集

KITTI 是一套计算机视觉算法评测数据集,其主要用于自动驾驶场景下的相关测试,评测种类涵盖立体图像、光流、视觉测距、3D 物体检测和 3D 追踪等。KITTI 包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像有最多 15 辆车和 30 个行人,并且拥有不同程度的遮挡和…