SEVIR 天气事件数据集

SEVIR 全称 Storm EVent ImagRy,是一个经过标注、策划和时空对齐的数据集。该数据集包含经过雷达 (NEXRAD weather radars) 和卫星 (GOES-16) 采样并对齐的气象图像。 该数据集包含超过 10,000 个天气事件,每个事件由分辨率为…

Silhouettes 图像标注数据集

Silhouettes 又称 CalTech 101 Silhouettes,是一个基于 CalTech 101 图像标注的新数据集。该数据集将每个 CalTech 101 图像轮廓居中和缩放,并将其渲染到 DxD 像素图像平面上。该数据集包括: 4100 个训练样本2264 个…

Moving MNIST 视频数据集

Moving MNIST 数据集包含 10,000 个视频序列,每个序列由 20 帧组成。 在每个视频序列中,两个数字在画面内独立移动,其空间分辨率为 64×64 像素。这些数字经常相互交错,并从帧的边缘弹出。

Q-Traffic 交通预测数据集

Q-Traffic是一个大规模的交通预测数据集,包括三个子集: query sub-dataset:采集自百度地图,包含大约 1.14 亿条用户查询。每个查询都记录了开始时间戳、开始位置坐标、目的地坐标、预估行程时长(分钟)。 traffic speed sub-dataset:…

PDB 蛋白质结构数据集(全球版)

PDB 蛋白质结构数据集,是一个专门收录蛋白质及核酸的三维结构资料的数据库,拥有十分悠久的历史,由美国布鲁克黑文国家实验室的 Walter Hamilton 于 1971 年起开始构建收集。 PDB 数据库中信息主要包含:蛋白质/核酸来源,蛋白质/核酸分子组成,原子坐标,测定结构…

LMD-full MIDI 数据集

LMD-full数据集全称为The Lakh MIDI Dataset v0.1完整版,该数据集有超过17万个独一的MIDI文件,其中4万5千个文件匹配到了百万歌曲数据集。该数据集的目标是促进大规模音乐信息检索,包括符号(仅使用MIDI文件)和基于音频内容(使用从MIDI文件中提…

Denver Crime 丹佛市犯罪记录数据集

该数据集由科罗拉多州丹佛市提供,包括了过去五年中丹佛市的犯罪记录。这些数据都是基于美国国家事件报告系统(NIBRS),且数据是动态的,允许随时添加修改等操作,犯罪数据在周一至周五更新。此数据集可被用作于犯罪类研究调查。

NYS Environment 环境数据集

环境修复站点是指根据DEC补救计划之一进行修复的区域,该环境整治站点数据集是由美国纽约州发布整理,包含已被修复或正在管理的站点记录。每个站点记录包括:站点名称,分类,唯一站点代码,站点位置和站点所有者, 在现场实施的机构和工程管制以及已知或将被处置的废物记录

Peace Agreements 和平协议数据集

该数据集是爱丁堡大学PA-X和平协议数据库的副本,该数据库是从1990年至2016年1月1日的140多个进程中的1500多个和平协议的储存库。数据集内容主要包括协议文本、签署协议的方案及其他相关元素

THUCNews 新闻数据集

THUCNews数据集是根据新浪新闻2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档,均为UTF-8纯文本格式。此数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏…