CONCODE 是一个新的代码示例大型数据集。数据集包含 10 万多个示例(包括来自在线代码存储库的Java 类)。该数据集开发了一种新的编码器解码器架构,用于模拟方法文档和类环境之间的交互。
机构: University of Washington
FFHQ-Aging 年龄图像数据集
FFHQ 全称 Flickr-Faces-High-Quality。FFHQ-Aging 是一个人脸数据集,旨在为年龄转换算法以及相关视觉任务提供 benchmark。它是 NVIDIA FFHQ 数据集的延伸,在 7 万张原始 FFHQ 图像的基础上增加了更多信息。 图像增加信…
PhotoShape 逼真 3D 形状图像数据集
PhotoShape 全称 Photorealistic Shape,是带有逼真外观模样的 3D 形状图像数据集。图像是由作者设计的系统合成。系统对真实照片中的材料进行分类,并利用 3D-2D 对齐技术将材料转移到每个形状的不同部位,进而合成效果图。其中 Herman Mille…
MusicNet 音乐数据集
MusicNet 是一个大型音乐数据集,用以监督和评估音乐研究的机器学习方法。该数据集由 330 张版权免费的古典音乐唱片以及超100万个注释标签组成。注明了每张唱片每个音符出现的准确时间、演奏该音符的乐器以及该音符在作品韵律结构中的位置。这些标签经由音乐家评估验证,得出标签的错…
CRUW 雷达目标检测数据集
CRUW 是一个用于雷达目标检测 (radar object detection) 任务的数据集。该数据集包含基于雷达数据的系统性标注和评估系统,其中涉及在各种驾驶场景中收集的 RGB 图像和雷达射频图像。
VCR 视觉常识推理数据集
VCR 全称 Visual Commonsense Reasoning,是一个用于视觉常识推理的大规模数据集。该数据集提出了关于图像的具有挑战性的问题,机器需要完成两个子任务:正确回答问题以及提供理由证明其答案的合理性。 VCR 数据集包含大量问题,其中 212K 个用于训练,2…
MPI Sintel 光流评估图像数据集
MPI (Max Planck Institute) Sintel 是一个用于光流评估的数据集,包含了 1,064 个合成立体图像和用于视差的 ground-truth 数据。Sintel 数据来自开源 3D 动画短片《Sintel》。该数据集有 23 个不同的场景,立体图像为 …
MegaFace 面部识别数据集
MegaFace Dataset 是一套公开面部识别数据集,其包含 690,000 人共计 1,000,000 张图片,相关数据均由华盛顿大学从 Flickr 收集。