QED 全称 Dataset for Explanations in Question Answering,是一个由专家标注的问答解析数据集,建立在 Google Natural Questions 数据集的一个子集上。 QED 是用于问答解析的语言学原则性框架数。给定一个问题和…
机构: Stanford University
Stanford Background 场景图像数据集
该数据集包含 715 张带有标注的 RGB 图像。这些图像均是室外场景,至少包含一个前景对象,大小约为 320 X 240 像素,选自现有的公共数据集:LabelMe、MSRC、PASCAL VOC和Geometric Context。该数据集可用于评估几何和语义场景理解方法。
Image Paragraph Captioning 图像描述数据集
Image Paragraph Captioning 数据集可用于评估为图像生成的描述片段。该数据集包含来自 Visual Genome 数据集的 19,561 张图片。每张图片包含一个段落。训练/评价/测试集分别包含14,575、2,487、2,489 张图像。 每张图像还包含…
Gibson Environment 感知数据集
Gibson Environment 是一个开源的感知和模拟数据集。数据集用于探索机器人的主动和对现实世界的感知,对现实世界进行感知学习。数据集基于虚拟化的真实空间,而非人工设计的空间。数据集包含了 572栋完整建筑的 1,400 多个楼层空间。该数据集主要特点是:I. 来自现实…
MultiTHUMOS 行为识别数据集
行为识别中,每一帧都极为重要。要全面理解视频中的人体行为,就要根据动作对每一帧进行标注,在一段视频中密集地标注。MultiTHUMOS 数据集是在对THUMOS 数据集扩展的基础上诞生的。 该数据集是一个动作标注集合,包括了 65 个动作类的 38,690 个标注。标注应用于 T…
Referlt3D 语言数据集
Referlt3D 数据集适用于 3D visual grounding 及 3D dense captioning 任务,包括 2 个大规模 visio-linguistic 互补的数据集: Sr3D 数据集:包含 83.5K 基于模板的句子,利用细粒度对象类之间的空间关系,定…
MetaShift 机器学习数据集
MetaShift 数据集包含涉及 410 个类别的 12,868 组自然图像,可用于衡量和评估机器学习模型对数据转变的稳健程度。
PASCAL-Part 目标检测数据集
PASCAL-Part 是 PASCAL VOC 2010 数据集的一组附加标注,为检测对象的每个身体部位提供分割掩码。而对于像船那样部件并不一致的检测对象,该数据集则会提供轮廓标注。 此外,PASCAL-Part 也可用以进行人体语义部分分割,包含了所有图像中的人像(其中 1,…
Taskonomy 室内场景数据集
Taskonomy 一个包含各种室内场景的大型高质量数据集,包括来自 500 多座建筑的 450 多万张来自室内场景的图像。 该数据集涵盖了 26 个视觉领域的常见任务,包括但不限于:2D 边缘检测、平面法线、拼图、自动上色、房间布局构建、物体分类、场景预测 。每一张图片有这 2…
PartNet 大规模 3D 模型数据集
PartNet 是一个大规模 3D 物体数据集,并标注了细粒度、实例级和分层 3D 零件信息。该数据集由 26,671 个 3D 模型的 573,585 个零件实例组成,涵盖 24 个物体类别。 该数据集可用于多种任务,如形状分析、动态 3D 场景建模和模拟、承受力分析等。
2D-3D-S 室内空间图像数据集
全程 2D-3D-Semantic,是一个大型室内空间图像数据集,涉及的室内面积高达 6,000 平方米,包含超过 70,000 张 RGB 图像,以及相应的深度、表面法线、语义标注、全局 XYZ 图像(所有形式均为规则和 360° 等矩形图像)、相机信息、注册信息、语义标注的 …
Visual7W 视觉问答数据集
Visual7W 是一个图像内容理解的数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答(Visual Question Answering) 任务,数据集中不仅包含图像本身,还包括图像区域内容相关的问答。 Visual7W 是 Visual Genome 数据集的一…
ShapeNetCore V1+V2 三维模型数据集
ShapeNetCore 是 ShapeNet 数据集的一个子集,包括独立干净的 3D 模型,以及人工验证的类别和对齐标注。该数据集涵盖了 55 个常见的物体类别,约 51,300 个独特的 3D 模型。 PASCAL 3D+ 是一个流行的计算机视觉 3D 基准数据集,其中的 1…
Make3D 单目深度估计数据集
Make3D 数据集是一个单目深度估计数据集,包含 534 对 RGB-D 图像对(包括 RGB 图像及其对应的深度图像)。其中,400 对图像对用于训练,134对图像用于测试。RGB 图像具有高分辨率,而深度图是低分辨率的。 每帧图像的深度值均由激光雷达进行采集,相较于 Kin…
CheXpert X 射线胸片数据集
CheXpert 全称 Chest eXpert,是一个用于解释 X 射线胸片的大型数据集。 该数据集包括来自 65,240 位患者的 224,316 张含正面和侧面视图的 X 射线胸片,具有不确定性医学标签和放射科医生标注的参考标准评估集,可用于预测来自多视角胸片的 14 种不…