Dogs-in-the-wild 犬类图像数据集

Dogs-in-the-Wild 数据集是一个用于细粒度分类任务的大规模犬类数据集。该数据集按类别的覆盖范围、数据量和标注质量超过了类似的现有数据集。 该数据集包含涉及 362 个犬类的 299,458 张图片,比 Stanford Dogs 数据集大 15 倍。其中训练集包含 …

ApolloCar3D 汽车 3D 模型数据集

ApolloCar3D 是一个关于汽车 3D 模型实例的数据集。数据集包含 5277 张驾驶图像和超过 6 万的汽车实例。其中每辆车都配备了具有绝对模型尺寸和语义标注关键点的行业级 3D CAD 模型。该数据集比当前最先进的 PASCAL3D+ 和 KITTI 大 20 倍以上。

iChallenge-PM 视网膜眼底图像数据集

据相关研究显示,病理性近视易对患者的视力造成不可逆转的损害。因此病理性近视的早期诊断与定期随访,显得极为重要。为此,Challenge-PM 视网膜眼底图像数据集便应运而生。 该数据集包括了 1200 张带有标注的视网膜眼底图像,以及一个评估框架,以便对所有提交结果进行统一评价与…

iChallenge-GON 健康数据集

iChallenge-GON 是一个包含 1200 张带标注的视网膜眼底图像的大型数据集。 该数据集按照 1:1:1 的比例,平均分成了 3 个子集,分别用于训练、离线验证 (offline validation) 和现场测试 (onsite test),每个子集的青光眼存在的比…

FM-IQA 多语种问答数据集

FM-IQA 全称 Freestyle Multilingual Image Question Answering,是一个问答数据集,包含 15 万张图像和 31 万个自由式中文问答对及其英文翻译。该数据集可用于训练和评估 mQA 模型。该模型可用于回答关于图像内容的问题,答案可…

DuIE 大规模中文信息抽取数据集

DuIE 是一个大规模的人工标注数据集,可用来评估基于架构的知识抽取算法。 该数据集包含超过 21 万个现实世界的中文句子,其中涉及超过 45 万个 SPO 三元组 (即:Subject-Predicate-Object triples),由预先指定的架构与 49 种谓语组成。 …

ApolloScape 自动驾驶数据集

ApolloScape 是 Apollo 自动驾驶项目的一部分,旨在促进自动驾驶从感知、导航到控制各个领域的创新。该数据集在数据规模、标签密度及任务等方面仍在不断更新。 该数据集包括(当前阶段): 环境密集语义 3D 点云(20+ 驾驶站点)立体声驾驶视频(100+ 小时)高精度…

CCMT 2019-BSTC 语音翻译语料库

BSTC 全称 Baidu Speech Translation Corpus,是一个大型自动同声传译数据集, 用于自动同声传译系统的构建。 该语料库分为训练集、开发集和测试集 3 个子集,每个子集包括: -声音信号文件,命名为 baidu_XX.wav -描述文件,包括每个声音…

SAOKE 人工标注数据集

SAOKE 全称 Symbol Aided Open Knowledge Expression,是一个人工标注数据集,包含 4 万多个中文句子和 SAOKE 形式的相应事实,是开放域信息抽取任务中,最大的公开可用的人工标注数据集。 该数据集具有以下优点: 数据真实且开放使用:遵循…

Video Highlights 高光帧提取数据集

Video Highlights 数据集包含了超过 1470 个完整的综艺节目视频(约 1200h)的播放链接和包含提取特征的文件。其中 Highlight Clips 包括 18,000 个视频,总时长约 750 个小时,每个视频都精准标注了时间戳。研究人员可以利用训练数据集中…

ICDAR_2019_LSVT 数据集

ICDAR 2019-LSVT (Large-scale Street View Text) 是一个大规模场景文本数据集。 该数据集包括 450,000 个带文本的图像,均拍摄自真实街道(如店面、地标等),其中 400,000 个图像为部分标注,作为训练数据;50,000 个图像…

ICDAR_2019_ArT 数据集

ICDAR 2019 ArT 是一个任意形状文本数据集。该数据集包括 10,176 张图像,其中 5603 张图像为训练集,4573 张图像为测试集。 该数据集中的图像源自 TotalText、CTW1500 和 LSVT 三个数据集,其中包含中文文本的部分源自百度街景,并以众包…

DuConv 对话数据集

DuConv 是一个基于电影和明星领域的数据集,包括票房、导演、评论等信息。 该数据集包括 30k 个对话,大约 120k 个对话回合。其中 20k 个对话为训练集,2k 个对话为开发集,8k 个对话用于构建测试样本。对话集和开发集中的每个对话都包含对话目的、背景知识和…