Stanford Background 场景图像数据集

该数据集包含 715 张带有标注的 RGB 图像。这些图像均是室外场景,至少包含一个前景对象,大小约为 320 X 240 像素,选自现有的公共数据集:LabelMe、MSRC、PASCAL VOC和Geometric Context。该数据集可用于评估几何和语义场景理解方法。

Image Paragraph Captioning 图像描述数据集

Image Paragraph Captioning 数据集可用于评估为图像生成的描述片段。该数据集包含来自 Visual Genome 数据集的 19,561 张图片。每张图片包含一个段落。训练/评价/测试集分别包含14,575、2,487、2,489 张图像。 每张图像还包含…

Gibson Environment 感知数据集

Gibson Environment 是一个开源的感知和模拟数据集。数据集用于探索机器人的主动和对现实世界的感知,对现实世界进行感知学习。数据集基于虚拟化的真实空间,而非人工设计的空间。数据集包含了 572栋完整建筑的 1,400 多个楼层空间。该数据集主要特点是:I. 来自现实…

MultiTHUMOS 行为识别数据集

行为识别中,每一帧都极为重要。要全面理解视频中的人体行为,就要根据动作对每一帧进行标注,在一段视频中密集地标注。MultiTHUMOS 数据集是在对THUMOS 数据集扩展的基础上诞生的。 该数据集是一个动作标注集合,包括了 65 个动作类的 38,690 个标注。标注应用于 T…

Referlt3D 语言数据集

Referlt3D 数据集适用于 3D visual grounding 及 3D dense captioning 任务,包括 2 个大规模 visio-linguistic 互补的数据集: Sr3D 数据集:包含 83.5K 基于模板的句子,利用细粒度对象类之间的空间关系,定…

PASCAL-Part 目标检测数据集

PASCAL-Part 是 PASCAL VOC 2010 数据集的一组附加标注,为检测对象的每个身体部位提供分割掩码。而对于像船那样部件并不一致的检测对象,该数据集则会提供轮廓标注。 此外,PASCAL-Part 也可用以进行人体语义部分分割,包含了所有图像中的人像(其中 1,…

Taskonomy 室内场景数据集

Taskonomy 一个包含各种室内场景的大型高质量数据集,包括来自 500 多座建筑的 450 多万张来自室内场景的图像。 该数据集涵盖了 26 个视觉领域的常见任务,包括但不限于:2D 边缘检测、平面法线、拼图、自动上色、房间布局构建、物体分类、场景预测 。每一张图片有这 2…

PartNet 大规模 3D 模型数据集

PartNet 是一个大规模 3D 物体数据集,并标注了细粒度、实例级和分层 3D 零件信息。该数据集由 26,671 个 3D 模型的 573,585 个零件实例组成,涵盖 24 个物体类别。 该数据集可用于多种任务,如形状分析、动态 3D 场景建模和模拟、承受力分析等。

2D-3D-S 室内空间图像数据集

全程 2D-3D-Semantic,是一个大型室内空间图像数据集,涉及的室内面积高达 6,000 平方米,包含超过 70,000 张 RGB 图像,以及相应的深度、表面法线、语义标注、全局 XYZ 图像(所有形式均为规则和 360° 等矩形图像)、相机信息、注册信息、语义标注的 …

Visual7W 视觉问答数据集

Visual7W 是一个图像内容理解的数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答(Visual Question Answering) 任务,数据集中不仅包含图像本身,还包括图像区域内容相关的问答。 Visual7W 是 Visual Genome 数据集的一…

ShapeNetCore V1+V2 三维模型数据集

ShapeNetCore 是 ShapeNet 数据集的一个子集,包括独立干净的 3D 模型,以及人工验证的类别和对齐标注。该数据集涵盖了 55 个常见的物体类别,约 51,300 个独特的 3D 模型。 PASCAL 3D+ 是一个流行的计算机视觉 3D 基准数据集,其中的 1…

Make3D 单目深度估计数据集

Make3D 数据集是一个单目深度估计数据集,包含 534 对 RGB-D 图像对(包括 RGB 图像及其对应的深度图像)。其中,400 对图像对用于训练,134对图像用于测试。RGB 图像具有高分辨率,而深度图是低分辨率的。 每帧图像的深度值均由激光雷达进行采集,相较于 Kin…

CheXpert X 射线胸片数据集

CheXpert 全称 Chest eXpert,是一个用于解释 X 射线胸片的大型数据集。 该数据集包括来自 65,240 位患者的 224,316 张含正面和侧面视图的 X 射线胸片,具有不确定性医学标签和放射科医生标注的参考标准评估集,可用于预测来自多视角胸片的 14 种不…