TDIUC 视觉问答数据集

日期

9 个月前

大小

37.97 GB

机构

发布地址

kushalkafle.com

特色图像

TDIUC 全称 Task Directed Image Understanding Challenge,是一个视觉问答数据集。数据集包括来自 MS COCO 和视觉基因组数据集的 160 万个问题及 17 万张图像;image-question pair 被分为 12 个类别及 4 个额外的评价矩阵 (evaluation matrices),用于评估模型稳健性及推理能力。

TDIUC 数据统计:

  • 12 种不同的问题类型(根据基本任务分组,其中包括一些「absurd」的问题)
  • 167,437 张图像(源自 MS-COCO 及 Visual Genome)
  • 165 万个 question-answer pair(3 个来源)
  • 4 个全新评估指标(旨在补偿偏见)
  • 6 个全新实验设置(回答 VQA 算法相关的关键问题)
TDIUC.torrent

做种 2

下载中 0

已完成 316

总下载 324

  • TDIUC/
    • README.md
      1.39 KB
    • README.txt
      2.78 KB
      • data/
          • Abstract_Scenes/
              • VQA_Annotations/
                • Annotations_Train_abstract_v002.zip
                  2.53 MB
                • Annotations_Val_abstract_v002.zip
                  3.79 MB
              • VQA_Input-Images/
                • scene_img_abstract_v002_test2015.zip
                  2.69 GB
                • scene_img_abstract_v002_train2015.zip
                  5.4 GB
                • scene_img_abstract_v002_val2015.zip
                  6.75 GB
              • VQA_Input-Questions/
                • Questions_Test_abstract_v002.zip
                  6.76 GB
                • Questions_Train_abstract_v002.zip
                  6.76 GB
                • Questions_Val_abstract_v002.zip
                  6.76 GB
          • Real_Images/
              • VQA_Annotations/
                • Annotations_Train_mscoco.zip
                  6.78 GB
                • Annotations_Val_mscoco.zip
                  6.78 GB
              • VQA_Input-Images/
                • test2015.zip
                  19.14 GB
                • train2014.zip
                  31.72 GB
                • val2014.zip
                  37.91 GB
              • VQA_Input-Questions/
                • Questions_Test_mscoco.zip
                  37.94 GB
                • Questions_Train_mscoco.zip
                  37.96 GB
                • Questions_Val_mscoco.zip
                  37.97 GB