43 个公开数据集
- Piazza Dante Dataset 是一个用于三维重建的图片数据集,其引入了一种用于计算结构和运用的分层方案,通过…
- Tanks Temple 是由坦克和寺庙照片组成的图像数据集,其主要用于三维重建,该数据集提供培训数据和测试数据两类,其…
- Roman Forum Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由…
- 清华学堂数据集基于 Riegl-LMS-Z420i 型激光扫描仪获取的建筑物真值数据,以及图像数据的三维重建数据集。其中…
- MPII Human Shape 是一个人体模型数据集,包括一系列人体轮廓和形状的 3D 模型及工具,其中训练模型从平面…
38 个公开数据集
- UCSD Pedestrian数据集包含UCSD加州大学圣地亚哥分校的行人录像视频,所有视频文件皆由两个观测点摄像头所拍…
- ORL Dataset 是剑桥大学 AT&T 实验室制作的人脸数据集,其包含从 1992 年 4 月到 1994…
- VGG-Face 2 Dataset 是一个大规模人脸识别数据集,其包含共计 9131 个人的面部数据,其图像均来自 G…
- 耶鲁人脸数据库是一个人脸数据集,主要用于身份鉴定,包含 15 个主题,其中每个主题有 11 张图像共计 165 个 GI…
- Caltech 10k Web Faces Dataset 是由 Google 搜索所得图片组成的数据集,每张图中正面的…
图像分类
图像分类描述
73 个公开数据集
- Highway Traffic Videos 数据集是由香港城市大学提供,解压后共 88 M(推荐使用百度网盘下载),数…
- fMRI Visual object recognition数据集是视觉识别物体时的fMRI图像数据组成的数据集,是Op…
- UCAS-AOD Dataset 是一个遥感影像数据集,其包含汽车和飞机两类目标以及背景负样本。 该数据集由国科大于 2…
- CIFAR-100 Dataset 是用于机器视觉领域的图像分类数据集,拥有 20 个大类,共计 100 个小类,其中每…
- HICO数据集是由密歇根大学发布,包含图片文件与一系列二进制数组用以表示标签,以二进制数来表示该图像是否存在这一系列行为…
3 个公开数据集
- COCO 是一个大型图像数据集,其被用于机器视觉领域的对象检测与分割、人物关键点检测、填充分割与字幕生成。该数据集以场景…
- NYU Depth V2 是各种室内场景视频序列组成的数据集,主要用于图像描述研究,其图像来自于 Microsoft K…
14 个公开数据集
- PoseTrack 是人类姿势估计和视频中的清晰跟踪的大规模基准,我们提供公开的培训和验证集以及评估服务器,用于对保留的…
- T-LESS 是被用于无纹理对象检测和 6D 姿态估计的 RGB-D 数据集,其被用于无纹理刚体对象 6D 姿态的估计。…
- Collective Activity 是一个集体活动的短视频数据集,它包含 5 种不同的集体活动,分别为交叉、步行、等…
- PASCAL 3D+ 是一个 3D 物体检测和姿态识别数据集,包括 PASCAL VOC 2012 中 12 个类别物体…
- HICO-DET数据集是由密歇根大学发布,包含图像文件以及相对应的边界框对(人与物)。该数据集可被用于图像检测等任务,并…
12 个公开数据集
- ADE20K Dataset 是用于场景解析的数据集,其包含 150 中物体类型,可被用于场景感知、解析、分割、多物体识…
- YTO Dataset 是由 YouTube 视频组成的数据集,其被用于 PASCAL VOC Challenge 的 …
- BDD Dataset 是一个视频数据集,其包含的 100,000 个高清视频序列时长超过 1100 小时,涵盖不同时间…
- BDD Dataset 是一个视频数据集,其包含的 100,000 个高清视频序列时长超过 1100 小时,涵盖不同时间…
- Visual Genome 是图像及图像内容语义信息相关数据集,相比于 ImageNet 图像标注数据集拥有更为丰富的语…
3 个公开数据集
- UCF-QNRF 由弗罗里达大学在 2018 年发布,共包括 1535 张人群图像,其中训练集 1201 张图像,测试集…
- ShanghaiTech 是一个大规模人群密集计数数据集,由上海科技大学在 2016 年发布,共计包括 1198 张人群…
- CityStreet: Multi-view crowd counting数据集是由香港城市大学提供,包括在旷阔视野的街…
6 个公开数据集
- Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点…
- OpenMIIR 是基于音乐感知和想象中拍摄的脑电图(EEG)录音的公共领域数据集。 该数据记录了 10 名测试者在被试…
- AclImdb - v1 Dataset 是用于二进制情绪分类的大型电影评论数据集,其涵盖比基准数据集更多的数据,其中有…
- 该数据集包括了四个领域的中文评论:笔记本电脑、汽车、相机和手机,评论属于二分类任务及正面或负面。可被用作于自然语言处理中…
39 个公开数据集
- Book - Crossing Dataset 是由 Book - Crossing 社区的 278858 名用户的评分…
- NLPCC2016数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。训练和测试数据由来自不同主题的微博组成…
- WikiText 长期依赖语言建模数据集包含 1 亿个英文词汇,其来自于 Wikipedia 优质文章和标杆文章。 该数…
- icwb2-data数据集是由北京大学、香港城市大学、台湾CKIP, Academia Sinica及中国微软研究所联合…
- Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点…
8 个公开数据集
- NLPCC2016数据集与流行的新闻数据集不同,使用更多来自新浪微博的非正式文本。训练和测试数据由来自不同主题的微博组成…
- WikiText 长期依赖语言建模数据集包含 1 亿个英文词汇,其来自于 Wikipedia 优质文章和标杆文章。 该数…
- icwb2-data数据集是由北京大学、香港城市大学、台湾CKIP, Academia Sinica及中国微软研究所联合…
- Legal Case Reports 是澳大利亚联邦法院的案件数据集,主要用于文本摘要。 该数据集包含 2006 年至 …
- BookCorpus 是一个曾经流行的大型文本语料库,经常用于语句编码/解码的无监督学习。 但是原作者已不再提供 Boo…
12 个公开数据集
- 该对联数据集共包含 70 余万条对联数据,按字切分,并分为训练数据集、测试数据集以及一份词汇表。其中,训练数据集、测试数…
- WikiText 长期依赖语言建模数据集包含 1 亿个英文词汇,其来自于 Wikipedia 优质文章和标杆文章。 该数…
- icwb2-data数据集是由北京大学、香港城市大学、台湾CKIP, Academia Sinica及中国微软研究所联合…
- Stanford Sentiment Treebank 是一个标准情感数据集,主要用于情感分类,其中每个句子分析树的节点…
- 布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸文本、书籍以及政府文件,包含 1,014,312 个单词的它主…
9 个公开数据集
- CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语…
- MSMARCO 是机器阅读理解数据集,其包含的 1,010,916 个匿名问题均来自 Bing 的搜索查询日志,日志中均…
- Yahoo!Answers 数据集源于 Yahoo!Answers Comprehensive Questions an…
- SQuAD(The Stanford Question Answering Dataset) 是一组阅读数据集,该数据集…
- Question Answer Dataset 是结合维基百科文章语料库的链接,并手动生成仿真问题和答案以供学术研究的问…
3 个公开数据集
- 该数据集是一个针对日文漫画的机器翻译评估数据集,包含五部不同风格(幻想、爱情、战斗、悬疑、生活)的漫画,数据集中共包含 …
- WMT 2015 French/English parallel texts 是用于训练翻译模型的法语/英语平行文本数据…
- European Parliament Proceedings Parallel Corpus 1996-2011 数据…
124 个公开数据集
- YouTube - 8M 是一个带标签的大型视频数据集,它由数百万个 YouTube 视频 ID 组成,包含的 3800…
- xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像的规模最大、质量最高的公共数据集之…
- Google Landmarks Dataset v2 是用于地标识别和图像恢复实验的数据集,其中包含人造和自然地标的标…
- fMRI Visual object recognition数据集是视觉识别物体时的fMRI图像数据组成的数据集,是Op…
- UCAS-AOD Dataset 是一个遥感影像数据集,其包含汽车和飞机两类目标以及背景负样本。 该数据集由国科大于 2…
17 个公开数据集
- Stanford Drone Dataset 是由各类行人的图像和视频组成的大型数据集,涵盖拥挤空间中的八种场景,例如大…
- MIT300数据集包含300张自然图像,因官方未发布39位观测者对于每一张图片的眼球追踪数据,该数据集仅可被作为测试数据…
- KITTI 是一套计算机视觉算法评测数据集,其主要用于自动驾驶场景下的相关测试,评测种类涵盖立体图像、光流、视觉测距、3…
- Dataset-UAV-123 是由低空无人机捕获视频组成的数据集,这与 OTB50、VOT2014 等主流跟踪数据集中…
- VOT 2016 Dataset 是被用于 2016 年 VOT 挑战的数据集。 VOT 挑战由 Open Challe…
13 个公开数据集
- SemanticKITTI 是自动驾驶领域的权威数据集,它基于 KITTI 数据集,对 KITTI Vision Odo…
- Camvid Dataset 是一个驾驶标签视频数据集,其包含 700 张像素级别的语义分割和图像分割,为了保证数据的准…
- Argoverse数据集包含 3D Tracking 和 Motion Forecasting两部分,Argoverse…
- Cityscapes 数据集包含 50 个不同城市街景中记录的视频序列,其中包含 20000 个弱注释帧和 5000 帧…
- L Lyft L5自动驾驶数据集是由Lyft公司提供的L5级别自动驾驶数据集,目前仅提供训练集的下载。该数据集包含高质量…
2 个公开数据集
- 该对联数据集共包含 70 余万条对联数据,按字切分,并分为训练数据集、测试数据集以及一份词汇表。其中,训练数据集、测试数…
5 个公开数据集
- Highway Traffic Videos 数据集是由香港城市大学提供,解压后共 88 M(推荐使用百度网盘下载),数…
- 该数据集是由合成生成的视频序列组成,其中包含多个动态纹理,每个合成视频序列包含2,3或4个动态纹理。此数据集具有300个…
- UCSD Pedestrian数据集包含UCSD加州大学圣地亚哥分校的行人录像视频,所有视频文件皆由两个观测点摄像头所拍…
16 个公开数据集
- iMat Fashion数据集中服装实例分割包括27个主要服装对象(夹克,裙子,裙子等)和19个服装部件(袖子,衣领等)…
- SBD Dataset 是一个语义边界数据集,其包含来自 PASCAL VOC 2011 数据集中 11355 张图片的…
- HAKE-HICO是由上海交通大学发布,基于HICO数据集进行的改良版。该数据集的图像文件使用了HICO数据集中原始图片…
- HICO数据集是由密歇根大学发布,包含图片文件与一系列二进制数组用以表示标签,以二进制数来表示该图像是否存在这一系列行为…
- SemanticKITTI 是自动驾驶领域的权威数据集,它基于 KITTI 数据集,对 KITTI Vision Odo…
14 个公开数据集
- VoxForge 是开源语音识别引擎的语音语料库和声学模型库,该数据集由 VoxForge 发布,其创建的初衷是为免费和…
- TIMIT 数据集由 8 种主要美国英语方言共 630 个录音片段组成,其中每个方言都有 10 个语音丰富的句子。 TI…
- 1 Billion Word Language Model Benchmark R13 Output 是一套新的基准语料…
- Common Voice英文数据集是由Common Voice提供,包含39577位测试者参与录音的MP3文件以及相对应…
- AVSpeech is a new, large-scale audio-visual dataset comprisi…
7 个公开数据集
- Set5,Set14 Dataset 是基于非负邻域嵌入的低复杂度单图像超分辨率的数据集,该训练集被用于单幅图像超分辨率…
- Urban100 包含了具挑战性的城市景色,具有不同频带的细节。 对真实图像利用双三次插值进行降尺度可以得到 LR/HR…
- 2014 Stereo数据集包括33个600万像素子数据集,是由Middlebury College收集,德国DLR改善…
- Sun-Hays 80 Dataset 是被用于超分辨率图像研究的数据集,它利用全局场景描述在图像数据库进行相关场景的比…
- Flickr1024数据集是一个大型的图像数据集,由1024个高质量的图像对组成,涵盖了各种各样的场景。该数据集可用于图…
50 个公开数据集
- Book - Crossing Dataset 是由 Book - Crossing 社区的 278858 名用户的评分…
- Million Song 数据集的核心数据是 The Echo Nest 发布的 Taste Profile 子集,它由…
- Last.fm 是一个歌曲数据集,它包含最大的歌曲级别标签和预先计算的歌曲级别相似性研究。 所有的数据都与 MSD 歌…
- 此数据集是由Datafinit数据库所提供,包含10000双女鞋及产品信息。具体内容有鞋子名称、品牌、价格等。该数据集可…
- 该数据集是由威斯康星大学麦迪逊分校提供,包括每个春季与秋季所开放的所有课程,教师,科目及相关成绩报告。此数据集中有超过9…