Place365-Challenge-2016 图像分类数据集

Place365-Challenge-2016数据集为Place365-Standard数据集的扩充版,包含了620万张额外的图像照片,训练集中总计共有800万张相片。Place365系列数据集是由MIT发布,帮助场景分类的数据集。该数据集应用范围广泛,数据庞大,对于场景分类型模…

Places-Extra69 图像分类数据集

Places-Extra69数据集为Place365数据集的额外扩充版,包含69种额外场景分类。该数据集包括98721张训练图片和6600张测试图片,对于之前版本的Place365数据集进行了进一步的扩充。Place365系列数据集是由MIT发布,帮助场景分类的数据集。该数据集应…

MIT300 眼球追踪数据集

MIT300数据集包含300张自然图像,因官方未发布39位观测者对于每一张图片的眼球追踪数据,该数据集仅可被作为测试数据集使用,并不能训练模型。使用者可以开发研究眼球追踪类模型并以此数据集作为测试集,发送邮件至saliency@mit.edu得到官方反馈。详情请浏览http://…

TIMIT 方言录音数据集

TIMIT 数据集由 8 种主要美国英语方言共 630 个录音片段组成,其中每个方言都有 10 个语音丰富的句子。 TIMIT 语料库包括时间对齐的正交,语音和单词转录以及每个话语的 16kHz 语音波形文件。 该数据集由麻省理工学院、SRI 国际和德州仪器公司于 1993 年发…

MIT CBCL 身份鉴定数据库

MIT CBCL Dataset 是麻省理工学院 - 生物与计算中心公开供科研与学习的数据库,主要用于身份鉴定研究,该数据集包含两个部分,一部分为分辨率为 128 * 64 的 ppm 格式图片库,其包含 924 张图片;另一部分为从大图中切割而出的小图,主要包含胳膊、脑袋、脚、…

CMU Frontal Face Images 人脸图像数据集

CMU Frontal Face Images Dataset 是一个用于人脸识别和身份鉴定的图像数据集,包含 511 个闭合的人脸图像,其中有 130 个是正面的人脸图像,所有图片均为黑白的 GIF 格式。 CMU - MIT Dataset 由卡内基·梅隆大学和麻省理工学院于…

Labelme 图像数据集

Labelme Dataset 是用于目标识别的图像数据集,涵盖 1000 多个完全注释和 2000 个部分注释的图像,其中部分注释图像可以被用于训练标记算法,测试集拥有来自于世界不同地方拍摄的图像,这可以保证图片在续联和测试之间会有较大的差异。 该数据集由麻省理工学院 - 计算…

Pix3D 单图像三维形状建模数据集

Pix3D 是单图像三维形状建模数据集和方法,这是一套大规模基准且具有像素级 2D-3D 对齐的图像形状对,其在形状相关任务中被广泛应用,包括重建、检索、视点估计等。 该数据集由普林斯顿大学计算机系和麻省理工学院联合发布,主要发布人有 Xingyuan Sun、Jiajun Wu…

TIMIT 语音读取语料数据集

TIMIT 语音读取语料数据集是一套声学-音素连续语音语料库,其旨在为声学语音研究以及自动语音识别系统的开发与评估提供语音数据。 TIMIT 一共包含 6300 个句子,每段音频的语音采样频率为 16kHz,包含由八种主要美国英语方言组成的 630 个录音片段,每个方言都有 10…