Chinese Text in the Wild 中文字符数据集

Chinese Text in the Wild 是一个用自然图像中包含的文字创建的大型数据集。该数据集包含 32,285 张带有1,018,402 个中文字符的图像,远远超出了之前的数据集,这些图片来自腾讯街景,从中国数十个不同的城市获取,没有任何特殊目的。 由于其多样性和复杂…

CH-SIMS 多模态分类数据集

CH-SIMS 是一个中文数据集,可用于单模态和多模态情感分析。该数据集包含 2,281个精炼的真实视频片段,其中有多模态和单模态标注。该数据集可用于研究各种模态之间的交互,或使用独立的单模态标注进行单模态情感分析。

WebFace260M 人脸清洗数据集

WebFace260M 是一个百万级别的人脸基准。该数据集由 4M 身份 (identities) 和 260M 人脸组成,为百万级深度人脸清洗和识别提供了很好的资源。该基准是为研究团体而设计的,旨在缩小行业背后的数据鸿沟。 该数据集由以下数据构成: 包含大量噪声的数据:4 百万…

MARS 行人重识别视频数据集

MARS 全称 Motion Analysis and Re-identification Set,是一个大规模的行人重识别视频数据集,也是 Market-1501 数据集的扩充。 数据是由六个近乎同步的摄像机收集的。数据集包含 1,261 个不同的行人,每人至少被 2 个摄像机…