CryoNuSeg 实例分割数据集

CryoNuSeg 是一个用于冰冻切片 H&E 染色组织图像核实例分割的数据集。该数据集包含来自 10 个人体器官的图像,具有 512x512 像素的固定大小,并提供了三个人工标注,以允许测量观察者内和观察者间的变异性。

MinneApple 苹果检测数据集

MinneApple 是一个用于苹果检测和分割的基准数据集。该数据集使用多边形掩码为每个对象实例进行标注,以帮助进行精确的对象检测、定位、和分割。此外,该数据集提供了基于补丁的聚类水果计数数据。该数据集在 1000 张图像中包含超过 41,0000 个带标注的对象实例。

PASCAL-5i 小样本图像分割数据集

PASCAL-5i 是一个用于评估小样本分割的数据集。 该数据集被细分为 4 个部分,每个部分包含 5 个类别,共计 20 个类别。一个部分包含来自 5 个类别的带标注样本,用于评估小样本学习方法。其余的 15 个类别则用于训练。

Flickr30K Entities 数据集

Flickr30K Entities 是 Flickr30K 数据集的扩展。Flickr30K Entities 标注了 Flickr30K 数据集描述句子里提到的名词,并标注了对应的 bounding box。 该数据集为原来的 158K 个描述句子增加了 244K 条共指链 …

YouTubeVIS 视频实例分割数据集

YouTubeVIS 是一个可用于视频实例分割的大规模数据集,采集自 YouTubeVOS 数据集。该数据集是为视频中目标实例的同步检测、分割和跟踪等任务设计的。 该数据集分为 2019、2021 和 2022 版本。最新版本为 2022 版本,用于 CVPR 2022 的第四届…

Virtual KITTI 合成视频数据集

Virtual KITTI 是一个具有照片真实感的合成视频数据集,用于学习和评估计算机视觉模型,以完成多个视频理解任务:目标检测和多目标跟踪、场景级和实例级语义分割、光流和深度估计。 该数据集包含 50 个高分辨率单目视频(21,260 帧),这些视频是在不同的成像和天气条件下,…

ApolloScape 自动驾驶数据集

ApolloScape 是 Apollo 自动驾驶项目的一部分,旨在促进自动驾驶从感知、导航到控制各个领域的创新。该数据集在数据规模、标签密度及任务等方面仍在不断更新。 该数据集包括(当前阶段): 环境密集语义 3D 点云(20+ 驾驶站点)立体声驾驶视频(100+ 小时)高精度…

iChallenge-PM 视网膜眼底图像数据集

据相关研究显示,病理性近视易对患者的视力造成不可逆转的损害。因此病理性近视的早期诊断与定期随访,显得极为重要。为此,Challenge-PM 视网膜眼底图像数据集便应运而生。 该数据集包括了 1200 张带有标注的视网膜眼底图像,以及一个评估框架,以便对所有提交结果进行统一评价与…

LVIS 词汇实例分割数据集

LVIS 全称 Large Vocabulary Instance Segmentation,是一个用于长尾实例分割的数据集。该数据集对 164k 图像中的 1000 多个目标类别进行了标注,提供了 200 万个高质量的实例分割 mask。 由于自然图像类别的齐夫定律分布,LVI…

DAVIS 目标分割数据集

Densely Annotation Video Segmentation dataset (DAVIS) 是一个高质量、高分辨率的视频目标分割数据集,包括 480p 和 1080p 两种分辨率。该数据集包括 50 个视频,在像素层面包含 3,455 密集标注的帧。其中,训练集包…

BDD100K 视频数据集(分卷版本)

BDD Dataset 是一个视频数据集,其包含的 100,000 个高清视频序列时长超过 1100 小时,涵盖不同时间、不同天气条件和驾驶场景,视频序列中还包括 GPS 位置、IMU 数据和时间戳。 其中道路目标检测是为公共汽车、交通灯、交通标志、人、自行车、卡车、摩托车、汽车…

YTO

YTO Dataset 是由 YouTube 视频组成的数据集,其被用于 PASCAL VOC Challenge 的 10 个移动对象类。 此版本提供了 PASCAL VOC 2007 格式的注释,以及用于 YTO V2.2 中相同的 7,000 个边界框注释,训练集中每帧标注…

PASCAL VOC DATASET

PASCAL VOC DATASET 由 Pascol VOC 项目组于 2012 年发布,其包含往届 PASCAL VOC 挑战赛的成果,同时这项挑战赛也与 2012 年完成最后一届。 PASCAL VOC 大赛是一项世界级计算机视觉挑战赛,该挑战赛由 Mark Evering…

Visual Genome Dataset V1.2 图像及图像内容语义信息的数据集

Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语义信息,其被用于拓展基于图像及语义信息的人工智能应用中。 该数据集目前包含 108249 张图片、420 万条区域内容描述、170 万条图像内容问答、210 万…