Oxford Radar RobotCar 雷达数据集

Oxford Radar RobotCar 是 Oxford RobotCar 数据集的雷达扩展数据集。数据是通过观测英国牛津中部的一条路线获得的。这些数据是在 2019 年 1 月收集的,穿越牛津市中心的一条路线 32 次,总共 280 公里的城市驾驶。该数据集包含各种天气、交…

CMD 电影数据集

CMD 全称 Condensed Movies Dataset,由 3K 多部电影中的关键场景组成:每个关键场景都附有场景的高级语义描述、人物脸部轨迹和电影的元数据。该数据集是可扩展的,从 YouTube 自动获取,任何人都可以免费下载使用。

e-SNLI-VE 大规模视觉语言数据集

e-SNLI-VE 是一个带有自然语言解释(natural language explanations)的大规模视觉语言数据集,其中包含超过 43 万个实例,所有的解释都是基于图像内容的。该数据集是通过合并 e-SNLI 数据集的解释和 SNLI-VE 数据集的图像-句子对而建立…

Oxford-IIIT Pets 宠物图像数据集

Oxford-IIIT Pets 是一个宠物图像数据集。该数据集涉及 37 个类别(其中犬类 25 类,猫类 12 类),每个类别大约有 200 张图片。这些图像在比例、姿势和光照条件方面有很大的差异。所有图像都有一个相应的 ground truth 标注,包括品种、头部 ROI…

FGVC- Aircraft 飞机精细视觉分类数据集

FGVC-Aircraft 全称 Fine-Grained Visual Classification of Aircraft,是一个飞机分类数据集。该数据集中每张飞机图像都用 bounding box 和模型标签进行了标注。 该数据集包括 10,200 张飞机图像(102 种飞…

CIFAR-FS 分类图像数据集

CIFAR-FS 全称 CIFAR100 few-shots,是通过使用生成 miniImageNet 的相同标准从 CIFAR-100 数据集中随机抽取的。该数据集共包含 100 个类别,其中每个类别 600 张图像,合计 60,000 张图像。 平均来说,类别之间的相似度很高…

DTD 纹理识别数据集

DTD 全称 Describable Textures Dataset,是一个不断更新的纹理数据集,由 5,640 张图像组成,根据人类感知分为 47 个类别,每个类别有 120 张图像,对于每一个图像还提供关键属性和联合属性列表。 该数据集目的在于进一步了解智能系统如何处理、分…

VoxCeleb1 声纹识别数据集

这是一个大规模且与文本无关的声纹识别数据集,包含来自 YouTube 视频中 1,251 位名人的 10 万条语音。 示例数据: Verification split: devtest# of speakers1,21140# of videos21,819677# of utt…

VoxCeleb2 语音识别数据集

VoxCeleb2 是一个源自开源媒体的大规模说话人 (Speaker) 识别数据集,由超过 6 千名说话者的一百万条语料组成。由于该数据集是在自然场景中收集的,因此语音片段中不乏笑声、交谈声、频道效果、音乐等干扰。 VoxCeleb2 中的语料是多语言的,说话者来自 145 个…

PASCAL VOC DATASET

PASCAL VOC DATASET 由 Pascol VOC 项目组于 2012 年发布,其包含往届 PASCAL VOC 挑战赛的成果,同时这项挑战赛也与 2012 年完成最后一届。 PASCAL VOC 大赛是一项世界级计算机视觉挑战赛,该挑战赛由 Mark Evering…

VGG-Face 人脸识别数据集

VGG - Face Dataset 是爬取网页上名人图片的数据集,其中包含 2622 个名人图片,该数据集旨在与流行的面部识别基准数据集没有重叠,其中包括 Labeled Faces in the Wild(LFW),YouTube Faces Dataset 和 IARPA …

VGG-Face2 人脸识别数据集

VGG-Face 2 Dataset 是一个大规模人脸识别数据集,其包含共计 9131 个人的面部数据,其图像均来自 Google 的图片搜索,在姿势、年龄、种族和职业方面有很大差异。 该数据集由牛津大学·工程科学系视觉几何组于 2015 年发布,相关论文有《Deep Face …

Oxford 102 Flowers 花卉图片数据集

Oxford 102 Flowers Dataset 是一个花卉集合数据集,主要用于图像分类,它分为 102 个类别共计 102 种花,其中每个类别包含 40 到 258 张图像。 该数据集由牛津大学工程科学系于 2008 年发布,相关论文有《Automated flower c…