STPLS3D 点云数据集

STPLS3D 全称 Semantic Terrain Points Labeling - Synthetic 3D,旨在为语义分割及实例分割任务,提供一个大规模航拍测量数据集(包含合成 & 真实标注的 3D 点云)。 该数据集包含:  1.27 平方公里景观的…

EMNIST 手写数字数据集

EMNIST 全称 Extended MNIST,是 NIST Special Database 19 的扩展数据集。这个数据集将图像转换为 28x28 像素的图像格式,以及与 MNIST 数据集匹配的数据集结构。 该数据集的数据量是 MNIST 的 4 倍,包含: EMNIST…

BAM! Behance 艺术品数据集

BAM! 全称 Behance Artistic Media,是 Behance 网站当代艺术作品的大规模数据集,该网站包含数百万专业和商业艺术家的作品集。作者用丰富的属性标签(内容、情绪、艺术媒体)标注了 Behance 图像。 数据集包括: 超过 250 万张图像的自动标记二…

QMNIST 大型手写数字数据集

QMNIST 大型手写数字数据集由 NIST Special Database 19 中找到的原始数据重构而成,并且重构了之前 MNIST 数据测试集中丢失的 50,000 张测试图像数据,形成了完整的 QMNIST 数据集。 经过重构算法、距离的最佳匹配和置信度区间的衡量,MN…

iNat2021 动物图像数据集

iNat2021 是一个大型图像数据集,包含了由科学家收集和标注的来自1万个不同物种的超过 270 万张图像。 为了使数据集更易获取,作者还创建了一个 "迷你 "训练数据集。每个物种有 50 张训练图像,总共有 50 万张训练图像。每个物种有 10 张验证图像,总共有10 万张验…

Open Images Dataset 图像数据集

Open Images Dataset 包含约 900 万张标注图片,拥有 6000 个类别的标签,平均每张图像有 8 个标签,其分为包含 9,011,219 张图像的训练集、41,620 张图像的验证集和 125,436 张图像的测试集,它比拥有 1000 个类别标签的 Ima…

DBPedia Ontology 大型多域本体数据集

DBPedia Ontology 由 14 个不重叠分类的 40000 个训练样本和 5000 个测试样本组成,其使用来自维基百科派生的大型多域本体。 该数据集的英文版目前描述了 458 万个「事物」以及 5.83 亿个「事实」,其由康奈尔大学于 2015 年发布。

Amazon Reviews – Full 评论数据集

Amazon Reviews - Full Dataset 包含 34,686,770 条商品评论,包含 6,643,669 名亚马逊用户对 2,441,053 款产品的评价,该数据集主要来源于斯坦福网络分析项目 SNAP,其中每个类别分别包含 600,000 个训练样本和 13…

Amazon reviews – Polarity 评论数据集

Amazon Reviews - Polarity Dataset 是 Amazon Reviews - Full Dataset 的子集,相关数据主要来源于斯坦福网络分析项目,其中每个情绪极性集均包含 1,800,000 个训练样本和 200,000 个测试样本 。 该数据集由…

AG News 新闻文章数据集

AG News Dataset 拥有超过 100 万篇新闻文章,其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章,该数据集仅采用了标题和描述字段,每种类别均拥有 30,000 个训练样本和 1900 个测试样本。 该数据集由康奈尔大学于 2004 年…

CASIA-FASD 人脸活体检测数据集

CASIA-FASD 是一个包含了 50 位受试者的小型人脸活体检测数据集。目前人脸活体检测的方式主要有:照片打印、视频回放检测、3D人脸等。康奈尔大学的团队主要通过设计两个 CNN 模型来提高人脸反欺骗方法的通用性和适用性。

NYC Library 三维建模图片数据集

NYC Library Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Translatio…