BDD100K 视频数据集(分卷版本)

BDD Dataset 是一个视频数据集,其包含的 100,000 个高清视频序列时长超过 1100 小时,涵盖不同时间、不同天气条件和驾驶场景,视频序列中还包括 GPS 位置、IMU 数据和时间戳。 其中道路目标检测是为公共汽车、交通灯、交通标志、人、自行车、卡车、摩托车、汽车…

YTO

YTO Dataset 是由 YouTube 视频组成的数据集,其被用于 PASCAL VOC Challenge 的 10 个移动对象类。 此版本提供了 PASCAL VOC 2007 格式的注释,以及用于 YTO V2.2 中相同的 7,000 个边界框注释,训练集中每帧标注…

PASCAL VOC DATASET

PASCAL VOC DATASET 由 Pascol VOC 项目组于 2012 年发布,其包含往届 PASCAL VOC 挑战赛的成果,同时这项挑战赛也与 2012 年完成最后一届。 PASCAL VOC 大赛是一项世界级计算机视觉挑战赛,该挑战赛由 Mark Evering…

Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集

Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语义信息,其被用于拓展基于图像及语义信息的人工智能应用中。 该数据集目前包含 108249 张图片、420 万条区域内容描述、170 万条图像内容问答、210 万…

BDD 视频数据集

BDD Dataset 是一个视频数据集,其包含的 100,000 个高清视频序列时长超过 1100 小时,涵盖不同时间、不同天气条件和驾驶场景,视频序列中还包括 GPS 位置、IMU 数据和时间戳。 其中道路目标检测是为公共汽车、交通灯、交通标志、人、自行车、卡车、摩托车、汽车…

Sunnybrook Cardiac Data – 2009 年心脏 MR 左心室分割挑战数据

Sunnybrook Cardiac Dataset 又称 2009 年心脏 MR 左心室分割挑战数据集,被用于心脏病研究,它由来自患者和病例样本的 45 个影像组成,分别为健康、肥大、心肌梗塞和心脏衰竭。 该数据集由美国国立卫生研究院于 2003 年发布,相关论文有《Norma…

Pix3D 单图像三维形状建模数据集

Pix3D 是单图像三维形状建模数据集和方法,这是一套大规模基准且具有像素级 2D-3D 对齐的图像形状对,其在形状相关任务中被广泛应用,包括重建、检索、视点估计等。 该数据集由普林斯顿大学计算机系和麻省理工学院联合发布,主要发布人有 Xingyuan Sun、Jiajun Wu…

ADE20K 场景解析数据集

ADE20K Dataset 是用于场景解析的数据集,其包含 150 中物体类型,可被用于场景感知、解析、分割、多物体识别和语义理解。 该数据集由 MIT CSAIL 研究组于 2017 年发布和维护,相关论文有《Scene Parsing through ADE20K Data…