TextZoom 是一个超分辨率数据集,由成对的低分辨率(LR)和高分辨率(HR)图像组成。这些图像是由不同焦距的相机在野外拍摄的。每一个图像对都有区分大小写的字符串(包括标点符号)的标注、边界框类型和原始焦距。 该数据集按照难度分为有三个子集:困难、中等、简易,其中 LR 图像…
机构: SenseTime Research
ATD-12K 大规模动画三元组数据集
ATD-12K 是一个大规模动画三元组数据集,其中包含 12,000 个有丰富标注的三元组。其中训练集包含 10,000 个动画帧三元组,测试集包含 2,000 个三元组。该数据集从多元化制片人制作的 30 部系列电影中,共收录 101 个卡通片段,总时长超过 25 小时。采集的…
CelebAMask-HQ 人脸图像数据集
CelebAMask-HQ 是一个大规模人脸图像数据集。该数据集包含 3 万张从 CelebA 数据集中挑选的高分辨率人脸图像。 每个图像都有对应 CelebA 的人脸属性的分割掩码。CelebAMask-HQ 的 mask 大小为512 × 512,共有 19 类属性特征,包括…