PAD 全称 Purpose-driven Affordance Dataset,可用于可供性检测 (affordance detection),该任务指的是感知图像中具有潜在行动可能性的物体,是机器人感知和操纵的重要能力。 该数据集由来自 31 个 affordance 和 7…
机构: University of Science and Technology of China
CCPD 车牌数据集
CCPD 全称 Chinese City Parking Dataset,可用于车牌检测以及识别任务。CCPD 提供了超过 250 万个独特的车牌图像和详细的标注。每张图像的分辨率为 720 × 1160 像素。 在 CCPD 数据集中,每张图片仅包含一张车牌,车牌省份主要为皖。
VQA-E 视觉问答解析数据集
VQA-E 全称 Visual Question Answering with Explanation,是带有解析的视觉问答数据集,其涉及的模型需要预测并生成答案解析。它是由 VQA v2 数据集自动衍生出来的,为每个“图像-问题-答案三要素”合成为一个文本解析,这使得问答过程更…