Visual Madlibs 图像描述数据集

本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)

Visual Madlibs 包含 360,001 个针对 10,738 幅图像的自然语言描述。该数据集使用已自动生成的空白填充模板收集一些目标描述,包括:人和物体、外貌、活动和互动、以及对一般场景或更广阔背景的推论。