PoseTrack 多人视频姿态估计数据集

PoseTrack 是人类姿势估计和视频中的清晰跟踪的大规模基准,我们提供公开的培训和验证集以及评估服务器,用于对保留的测试集进行基准测试。 该数据集也是「ICCV 17」和「ECCV 18」研讨会挑战赛的基础。

MPII 人体姿势估计数据集

MPII 是用于评估人体姿势估计的数据集以及相关基准,拥有约 2.5 万张图像并且包含超过 4 万名具有注释关节的人,该数据集利用人类活动的既定分类法系统化收集图像。 总体来看,该数据集涵盖 410 种人类行为且每个图像都提供活动标签,每张图片均来自 YouTube 视频,并提供…

FLIC 影视人体检测数据集

FLIC 是从电影的帧中标记人物的图像数据集,其包含从主流好莱坞电影中收集的 5003 张图像。 训练图像来源于 30 部电影中运行的人物检测器,图片获取后由人工为其标注,包括 10 个上身关节,此外,图像中拥有 5 个中值标记以保证异常值注释具有鲁棒性。发布者会主动拒绝人被遮挡…

LSP (Leeds Sports Pose) 人体姿态估计数据集

Leeds Sports Pose 是一个体育姿势数据集,其被分为竞技、羽毛球、棒球、体操、跑酷、足球、排球和网球几类,共包含约 2000 个姿势注释,图像均来自于 Flickr 的运动人员。 通过对图像进行缩放,最突出的人长度约 150 像素,并且每个图像都注有 14 个联合位…

Pix3D 单图像三维形状建模数据集

Pix3D 是单图像三维形状建模数据集和方法,这是一套大规模基准且具有像素级 2D-3D 对齐的图像形状对,其在形状相关任务中被广泛应用,包括重建、检索、视点估计等。 该数据集由普林斯顿大学计算机系和麻省理工学院联合发布,主要发布人有 Xingyuan Sun、Jiajun Wu…

ITODD 工业 3D 物体检测数据集

MVTec ITODD 是用于 3D 物体检测和姿态估计的公共数据集,其重点关注工业设置和应用,该数据集由 28 个对象和 3500 个标记场景组成,场景中的对象实例均有 5 个传感器(两个 3D 传感器和三个灰度摄像机)进行收集。 该数据集由 MVTec Software Gm…

T-LESS 无纹理对象检测和 6D 姿态估计数据集

T-LESS 是被用于无纹理对象检测和 6D 姿态估计的 RGB-D 数据集,其被用于无纹理刚体对象 6D 姿态的估计。这套数据集拥有 30 个不同行业的对象,由于没有明显的纹理、可辨别的颜色和反射特性,因此物体在形状和尺寸上表现出对称性和相似性。 相较于其他数据集,T-LESS…

COCO 大型图像数据集

COCO 是一个大型图像数据集,其被用于机器视觉领域的对象检测与分割、人物关键点检测、填充分割与字幕生成。该数据集以场景理解为主,图像中的目标则通过精确的分割进行位置标定。 该数据集具有目标分割、情景感知和超像素分割三个特征,其包含 33 万张图像、150 万目标实例、80 个目…