VisDial 全称 Visual Dialog,是一个包含基于 MS COCO 数据集图像的人工标注问题的数据集。
该数据集是通过在亚马逊土耳其机器人上让两个受试者就一张图片进行聊天而开发的。其中一人充当提问者,另一人充当回答者。提问者只能看到图像的文本描述(即来自 MS COCO 数据集的图像标题),原始图像对提问者不可见。他们的任务是围绕这个图像提出问题,以 “ 更好地想象这个场景” 。回答者看到图像、标题并回答提问者提出的问题。他们两个人可以通过提问和回答问题来继续对话,最多可进行 10 轮。
VisDial v1.0 包含:
做种 2
下载中 1
已完成 360
总下载 458