ContactDB 是一个家用物品接触图像数据集。数据集通过使用热敏相机捕捉抓取过程中发生的丰富的手-物体接触。ContactDB 包括 50 个带有接触图纹理的家用物品的 3750 个 3D 网格和 37 万 5000 帧的同步的RGB-D+ 热成像。
机构: Georgia Institute of Technology
Dayton 交叉视图数据集
Dayton 是一个用于地面到空中(或空中到地面)图像转换或交叉视图图像合成的数据集。数据集包含道路视图和道路鸟瞰图共 76048 张图片(训练/测试拆分为 55000 / 21048 )。原始数据集中的图像分辨率为354×354 。
EQA 问答数据集
EQA 全称 Embodied Question Answering,是一个基于 House3D 的视觉问答数据集。在环境中任意位置的 agent 在得到一个问题后,能够自己在环境中寻找有用的信息并对该问题作出回答。比如:Q: 汽车是什么颜色的?为了回答这个问题,agent 必须…
PASCAL-5i 小样本图像分割数据集
PASCAL-5i 是一个用于评估小样本分割的数据集。 该数据集被细分为 4 个部分,每个部分包含 5 个类别,共计 20 个类别。一个部分包含来自 5 个类别的带标注样本,用于评估小样本学习方法。其余的 15 个类别则用于训练。
SegTrack-v2 视频多目标分割数据集
SegTrack-v2 是一个视频分割数据集,对视频中每一帧的多个目标,都进行老像素级的标注。 该数据集包含 14 个视频,24 个目标,总共有大约 1,000 帧。
EGTEA Gaze+ 日常活动视频数据集
EGTEA Gaze+ 全称 Extended Georgia Tech Egocentric Activity Gaze+,该数据集包含七种日常活动,如制作三明治、茶或咖啡。每项活动由四个不同的人进行,总共有 28 个视频。每段视频都有大约 20 个细粒度的动作实例,如拿面包、…
CURE-TSR 交通标志数据集
CURE-TSR 全称 CURE Traffic Sign Recognition,由超过 200 万张基于真实世界和模拟器数据的交通标志图像组成,涉及 14 个交通标志类别和不同的天气条件。该数据集源自 CURE-TSD 数据集。
MSeg 多域语义分割复合数据集
MSeg 是一个多域语义分割复合数据集。该数据集统一了来自不同领域的语义分割数据集:COCO、ADE20K、Mapillary、IDD、BDD、Cityscapes 和 SUN RGB-D。通过协调分类、合并和拆分类,得到了一个包含 194 个类别的统一分类。 为了使像素级的标注…
VisDial 图像对话数据集
VisDial 全称 Visual Dialog,是一个包含基于 MS COCO 数据集图像的人工标注问题的数据集。 该数据集是通过在亚马逊土耳其机器人上让两个受试者就一张图片进行聊天而开发的。其中一人充当提问者,另一人充当回答者。提问者只能看到图像的文本描述(即来自 …
Permuted MNIST 数字图像数据集
Permuted MNIST 是 MNIST 数据集的像素重排版。该数据集由 70,000 张从 0 到 9 的手写数字图像组成,其中 60,000 张图像用于训练,10,000 张图像用于测试。 该数据集与原始数据集 MNIST 的区别在于,每一个任务都是对输入像素的不同随机排…