UrbanSound8K 音频分类数据集

UrbanSound8K 是一个音频数据集,包含 8,732 个带标注的城市声音片段(≤4 秒)。该数据集包含 27 个小时的音频,其中有 18.5 个小时的音频带有事件发生的标注。 这些音频涉及 10 个类别:空调、汽车喇叭、儿童游戏、狗叫、钻孔、引擎声、枪声、手锤声、汽笛声和…

smallNORB 三维物体识别数据集

smallNORB 是一个用于根据形状识别 3D 物体的数据集。该数据集包含 50 个玩具的图像,从属于 5 个通用类别:四条腿的动物、人类形象、飞机、卡车和汽车。 这些物体是由两台摄像机在 6 种照明条件、9 种仰角(从 30 到 70 度之间的每 5 度)和 18 个方位角(…

fastMRI 核磁共振成像数据集

fastMRI 核磁共振成像数据集,是一个原始 MR 测量与 MR 图像的大型集合。该数据集包括了 膝关节 MRI 与大脑(神经)MRI,由训练集、验证集和掩盖测试集构成,主要可用于训练与评估 MR 图像重建的机器学习方法,同时也为缺乏医学成像背景的机器学习研究者,提供相应背景知…

NORB – 3D 物体图像识别数据集

NORB Dataset 是基于形状进行 3D 对象重定位的实验数据集,其包含四足动物、人物、飞机、卡车和汽车 5 个通用类别的 50 种玩具图像。数据集中的物体由两个相机在 6 种光照条件、9 个高度和 18 个方位角下成像,其由包含 5 个实例的训练集和包含 5 个实例的测试…

NYU Depth V2 视频序列数据集

NYU Depth V2 是各种室内场景视频序列组成的数据集,主要用于图像描述研究,其图像来自于 Microsoft Kinect 的摄像头记录。 该数据集包含 1449 个密集标记的对齐 RGB 和深度图像,并包含 3 个城市拍摄的 464 个新场景以及 407024 个未标记…

MNIST 手写数字数据集

MNIST Dataset 是一个手写数字数据集,其包含 60,000 个示例训练集和 10,000 个示例测试集,它主要用于机器视觉领域的图像分类,该数据集中的数字已经过尺寸标准化处理,并以固定尺寸的图像为中心。 MNIST Dataset 由纽约大学库兰特研究所、谷歌纽约实验…