HyperAI

Ensemble De Données De Réponses Visuelles Aux Questions Du TDIUC

特色图像

TDIUC, dont le nom complet est Task Directed Image Understanding Challenge, est un ensemble de données de questions-réponses visuelles. L'ensemble de données comprend 1,6 million de questions et 170 000 images provenant des ensembles de données MS COCO et Visual Genome ; Les paires image-question sont divisées en 12 catégories et 4 matrices d'évaluation supplémentaires pour évaluer la robustesse du modèle et la capacité de raisonnement.

Statistiques TDIUC :

  • 12 types de questions différents (regroupés par tâches de base, y compris certaines questions « absurdes »)
  • 167 437 images (de MS-COCO et Visual Genome)
  • 1,65 million de paires questions-réponses (provenant de 3 sources)
  • 4 nouvelles mesures d'évaluation (conçues pour compenser les biais)
  • 6 nouveaux paramètres expérimentaux (répondant à des questions clés sur les algorithmes VQA)
TDIUC.torrent
Partage 1Téléchargement 2Terminés 510Téléchargements totaux 499
  • TDIUC/
    • README.md
      1.39 KB
    • README.txt
      2.78 KB
      • data/
          • Abstract_Scenes/
              • VQA_Annotations/
                • Annotations_Train_abstract_v002.zip
                  2.53 MB
                • Annotations_Val_abstract_v002.zip
                  3.79 MB
              • VQA_Input-Images/
                • scene_img_abstract_v002_test2015.zip
                  2.69 GB
                • scene_img_abstract_v002_train2015.zip
                  5.4 GB
                • scene_img_abstract_v002_val2015.zip
                  6.75 GB
              • VQA_Input-Questions/
                • Questions_Test_abstract_v002.zip
                  6.76 GB
                • Questions_Train_abstract_v002.zip
                  6.76 GB
                • Questions_Val_abstract_v002.zip
                  6.76 GB
          • Real_Images/
              • VQA_Annotations/
                • Annotations_Train_mscoco.zip
                  6.78 GB
                • Annotations_Val_mscoco.zip
                  6.78 GB
              • VQA_Input-Images/
                • test2015.zip
                  19.14 GB
                • train2014.zip
                  31.72 GB
                • val2014.zip
                  37.91 GB
              • VQA_Input-Questions/
                • Questions_Test_mscoco.zip
                  37.94 GB
                • Questions_Train_mscoco.zip
                  37.96 GB
                • Questions_Val_mscoco.zip
                  37.97 GB