SemanticKITTI 数据集

SemanticKITTI 是自动驾驶领域的权威数据集,它基于 KITTI 数据集,对 KITTI Vision Odometry Benchmark 中的所有序列都进行了标注,同时还为 LiDAR 360 度范围内采集到的所有目标,进行了密集的逐点注释。 该数据集包含 28 个…

The Unsplash Lite Dataset 图片检索数据集精简版

Unsplash 是世界上最大的图片摄影网站之一,由全世界 20 多万摄影师参与贡献了数百万张高清优质的摄影作品。 Unsplash 在 2016 年开放了图片 API,截止目前已经达到了每月百万次调用,以及各种不同的使用场景。Unsplash 数据集于 2020 年八月宣布开放…

Visual Genome 图片语义分割数据集

Visual Genome数据集是机器视觉类数据集,包含108077张图片,540万个区域描述,170万份可视化问答数据,380万个目标实例,280万个属性以及230万个关系信息。该数据集是由斯坦福大学、Yahoo、丰田等共同合作完成,致力于将图片信息与语言紧密连接。

HICO 图像语义分割数据集

HICO数据集是由密歇根大学发布,包含图片文件与一系列二进制数组用以表示标签,以二进制数来表示该图像是否存在这一系列行为动作标签分类。图像包含多个主题如自行车、马、手机电话等,行为动作标签则包含握、骑、坐、行走等。可被用于图像分类任务。

MMID 图像分类数据集

MMID数据集是由宾夕法尼亚大学发布,是一个大规模多语言的图像数据集。并且数据集是双重平行的:对于每种语言,单词与表示单词的图像平行存储,并与单词翻译成英语(和相应的图像)平行。目前该数据集有98种语言,每种语言最多10,000个单词,此次下载仅提供中文版,详情可浏览:http:…

HAKE-HICO 语义分割数据集

HAKE-HICO是由上海交通大学发布,基于HICO数据集进行的改良版。该数据集的图像文件使用了HICO数据集中原始图片文件,在此基础上对于每幅图像的分类注释则与HICO数据集不同,进行了重新编排,包括了部位信息如脚踝、膝盖、手、肩等;动作信息如站立、行走、跳跃等。

PASCAL VOC DATASET

PASCAL VOC DATASET 由 Pascol VOC 项目组于 2012 年发布,其包含往届 PASCAL VOC 挑战赛的成果,同时这项挑战赛也与 2012 年完成最后一届。 PASCAL VOC 大赛是一项世界级计算机视觉挑战赛,该挑战赛由 Mark Evering…

SBD 语义边界数据集

SBD Dataset 是一个语义边界数据集,其包含来自 PASCAL VOC 2011 数据集中 11355 张图片的注释,这些图片均基于 Amazon Mechanical Turk,其中分割之间的冲突均为手动解决,此外,每张图像均由类别级别和实例界别的分段和边界,适用于 P…

Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集

Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语义信息,其被用于拓展基于图像及语义信息的人工智能应用中。 该数据集目前包含 108249 张图片、420 万条区域内容描述、170 万条图像内容问答、210 万…

Camvid 驾驶标签视频数据集

Camvid Dataset 是一个驾驶标签视频数据集,其包含 700 张像素级别的语义分割和图像分割,为了保证数据的准确性,每张图像均通过多次检查和确认以确保数据的准确性。该数据集解决了对实验数据的需求,并以定量评估新兴算法,其中驾驶场景增加了观察对象的数量和异质性,其提供超过…

Inria Aerial Image Labeling Dataset 遥感图像数据集

Inria Aerial Image Labeling Dataset 是一个用于城市建筑物检测的遥感图像数据集,其标记被分为建筑和非建筑两种,主要用于语义分割。 该数据集由 Inria 于 2017 年发布,相关论文有《Can Semantic Labeling Methods…

BSDS500 轮廓检测与语义分割数据集

BSDS 500 是用于轮廓检测和语义分割研究的数据集,包含从 30 个人类受试者中收集的 12000 个由手工标记的 1000 个 Corel 数据集图像。 其中一半的分割是通过向主体呈现彩色图像而获得的; 另一半来自呈现灰度图像,基于该数据的公共基准包括 300 个图像的所有…