TDIUC 视觉问答数据集

数据集下载 磁力链 下载帮助

TDIUC 全称 Task Directed Image Understanding Challenge,是一个视觉问答数据集。数据集包括来自 MS COCO 和视觉基因组数据集的 160 万个问题及 17 万张图像;image-question pair 被分为 12 个类别及 4 个额外的评价矩阵 (evaluation matrices),用于评估模型稳健性及推理能力。

TDIUC 数据统计:

  • 12 种不同的问题类型(根据基本任务分组,其中包括一些「absurd」的问题)
  • 167,437 张图像(源自 MS-COCO 及 Visual Genome)
  • 165 万个 question-answer pair(3 个来源)
  • 4 个全新评估指标(旨在补偿偏见)
  • 6 个全新实验设置(回答 VQA 算法相关的关键问题)
1 做种 0 下载 11 已完成
  • TDIUC/README.md 1.39 KB
  • TDIUC/README.txt 1.39 KB
  • TDIUC/data/Abstract_Scenes/VQA_Annotations/Annotations_Train_abstract_v002.zip 2.53 MB
  • TDIUC/data/Abstract_Scenes/VQA_Annotations/Annotations_Val_abstract_v002.zip 1.26 MB
  • TDIUC/data/Abstract_Scenes/VQA_Input-Images/scene_img_abstract_v002_test2015.zip 2.69 GB
  • TDIUC/data/Abstract_Scenes/VQA_Input-Images/scene_img_abstract_v002_train2015.zip 2.71 GB
  • TDIUC/data/Abstract_Scenes/VQA_Input-Images/scene_img_abstract_v002_val2015.zip 1.35 GB
  • TDIUC/data/Abstract_Scenes/VQA_Input-Questions/Questions_Test_abstract_v002.zip 4.19 MB
  • TDIUC/data/Abstract_Scenes/VQA_Input-Questions/Questions_Train_abstract_v002.zip 4.39 MB
  • TDIUC/data/Abstract_Scenes/VQA_Input-Questions/Questions_Val_abstract_v002.zip 2.13 MB
  • TDIUC/data/Real_Images/VQA_Annotations/Annotations_Train_mscoco.zip 11.6 MB
  • TDIUC/data/Real_Images/VQA_Annotations/Annotations_Val_mscoco.zip 5.75 MB
  • TDIUC/data/Real_Images/VQA_Input-Images/test2015.zip 12.36 GB
  • TDIUC/data/Real_Images/VQA_Input-Images/train2014.zip 12.58 GB
  • TDIUC/data/Real_Images/VQA_Input-Images/val2014.zip 6.19 GB
  • TDIUC/data/Real_Images/VQA_Input-Questions/Questions_Test_mscoco.zip 25.28 MB
  • TDIUC/data/Real_Images/VQA_Input-Questions/Questions_Train_mscoco.zip 20.97 MB
  • TDIUC/data/Real_Images/VQA_Input-Questions/Questions_Val_mscoco.zip 10.1 MB