日期
机构
发布地址
cs.stanford.edu
许可协议
其他
标签
图像描述
文本生成
问答数据集
分类
Image Paragraph Captioning 数据集可用于评估为图像生成的描述片段。该数据集包含来自 Visual Genome 数据集的 19,561 张图片。每张图片包含一个段落。训练/评价/测试集分别包含 14,575 、 2,487 、 2,489 张图像。
每张图像还包含 50 个区域描述(描述图像特定部分的短语)、 35 个对象、 26 个属性和 21 个关系以及 17 个问答对。