VisDial 图像对话数据集

数据集下载 磁力链 下载帮助

VisDial  全称 Visual Dialog,是一个包含基于 MS COCO 数据集图像的人工标注问题的数据集。

该数据集是通过在亚马逊土耳其机器人上让两个受试者就一张图片进行聊天而开发的。其中一人充当提问者,另一人充当回答者。提问者只能看到图像的文本描述(即来自 MS COCO 数据集的图像标题),原始图像对提问者不可见。他们的任务是围绕这个图像提出问题,以 “ 更好地想象这个场景”。回答者看到图像、标题并回答提问者提出的问题。他们两个人可以通过提问和回答问题来继续对话,最多可进行 10 轮。

VisDial v1.0 包含:

  • 训练集:1,23,287 张图片,每张图片 10 轮对话;
  • 验证集:2,064 张图片,每张图片 10 轮对话;
  • 测试集:8,000 张图片,每张图片 1 轮对话。
1 做种 0 下载 52 已完成
  • VisDial/README.md 1.58 KB
  • VisDial/README.txt 1.58 KB
  • VisDial/data/VisualDialog_test2018.zip 1.2 GB
  • VisDial/data/VisualDialog_val2018.zip 316.08 MB
  • VisDial/data/visdial_1.0_test.zip 3.14 MB
  • VisDial/data/visdial_1.0_train.zip 353.86 MB
  • VisDial/data/visdial_1.0_val.zip 5.63 MB