日期
机构
发布地址
tamaraberg.com
许可协议
其他
标签
图像检索
视觉问答
问答数据集
分类
图像描述
Visual Madlibs 包含 360,001 个针对 10,738 幅图像的自然语言描述。该数据集使用已自动生成的空白填充模板收集一些目标描述,包括:人和物体、外貌、活动和互动、以及对一般场景或更广阔背景的推论。