HyperAI초신경

TDIUC 시각적 질의응답 데이터 세트

特色图像

TDIUC는 과제 지향 이미지 이해 챌린지의 약자로, 시각적 질의응답 데이터 세트입니다. 이 데이터 세트에는 MS COCO 및 Visual Genome 데이터 세트에서 추출한 160만 개의 질문과 17만 개의 이미지가 포함되어 있습니다. 이미지-질문 쌍은 12개 카테고리로 나뉘고, 모델의 견고성과 추론 능력을 평가하기 위한 4개의 추가 평가 행렬이 있습니다.

TDIUC 통계:

  • 12가지의 다양한 질문 유형(일부 "터무니없는" 질문을 포함하여 기본 작업별로 그룹화됨)
  • 167,437개 이미지(MS-COCO 및 Visual Genome에서 제공)
  • 165만 개의 질문-답변 쌍(3개 출처)
  • 4가지 새로운 평가 지표(편견을 보상하도록 설계됨)
  • 6개의 새로운 실험 설정(VQA 알고리즘에 대한 핵심 질문에 답함)
TDIUC.torrent
시딩 1다운로드 중 2완료됨 510총 다운로드 횟수 499
  • TDIUC/
    • README.md
      1.39 KB
    • README.txt
      2.78 KB
      • data/
          • Abstract_Scenes/
              • VQA_Annotations/
                • Annotations_Train_abstract_v002.zip
                  2.53 MB
                • Annotations_Val_abstract_v002.zip
                  3.79 MB
              • VQA_Input-Images/
                • scene_img_abstract_v002_test2015.zip
                  2.69 GB
                • scene_img_abstract_v002_train2015.zip
                  5.4 GB
                • scene_img_abstract_v002_val2015.zip
                  6.75 GB
              • VQA_Input-Questions/
                • Questions_Test_abstract_v002.zip
                  6.76 GB
                • Questions_Train_abstract_v002.zip
                  6.76 GB
                • Questions_Val_abstract_v002.zip
                  6.76 GB
          • Real_Images/
              • VQA_Annotations/
                • Annotations_Train_mscoco.zip
                  6.78 GB
                • Annotations_Val_mscoco.zip
                  6.78 GB
              • VQA_Input-Images/
                • test2015.zip
                  19.14 GB
                • train2014.zip
                  31.72 GB
                • val2014.zip
                  37.91 GB
              • VQA_Input-Questions/
                • Questions_Test_mscoco.zip
                  37.94 GB
                • Questions_Train_mscoco.zip
                  37.96 GB
                • Questions_Val_mscoco.zip
                  37.97 GB