HyperAIHyperAI

Ensemble De Données De Réponses Visuelles Aux Questions Du TDIUC

Date

il y a 2 ans

Taille

37.97 GB

Organisation

URL de publication

kushalkafle.com

URL de l'article

arxiv.org

特色图像

TDIUC, dont le nom complet est Task Directed Image Understanding Challenge, est un ensemble de données de questions-réponses visuelles. L'ensemble de données comprend 1,6 million de questions et 170 000 images provenant des ensembles de données MS COCO et Visual Genome ; Les paires image-question sont divisées en 12 catégories et 4 matrices d'évaluation supplémentaires pour évaluer la robustesse du modèle et la capacité de raisonnement.

Statistiques TDIUC :

  • 12 types de questions différents (regroupés par tâches de base, y compris certaines questions « absurdes »)
  • 167 437 images (de MS-COCO et Visual Genome)
  • 1,65 million de paires questions-réponses (provenant de 3 sources)
  • 4 nouvelles mesures d'évaluation (conçues pour compenser les biais)
  • 6 nouveaux paramètres expérimentaux (répondant à des questions clés sur les algorithmes VQA)
TDIUC.torrent
Partage 2Téléchargement 0Terminés 625Téléchargements totaux 602
  • TDIUC/
    • README.md
      1.39 KB
    • README.txt
      2.78 KB
      • data/
          • Abstract_Scenes/
              • VQA_Annotations/
                • Annotations_Train_abstract_v002.zip
                  2.53 MB
                • Annotations_Val_abstract_v002.zip
                  3.79 MB
              • VQA_Input-Images/
                • scene_img_abstract_v002_test2015.zip
                  2.69 GB
                • scene_img_abstract_v002_train2015.zip
                  5.4 GB
                • scene_img_abstract_v002_val2015.zip
                  6.75 GB
              • VQA_Input-Questions/
                • Questions_Test_abstract_v002.zip
                  6.76 GB
                • Questions_Train_abstract_v002.zip
                  6.76 GB
                • Questions_Val_abstract_v002.zip
                  6.76 GB
          • Real_Images/
              • VQA_Annotations/
                • Annotations_Train_mscoco.zip
                  6.78 GB
                • Annotations_Val_mscoco.zip
                  6.78 GB
              • VQA_Input-Images/
                • test2015.zip
                  19.14 GB
                • train2014.zip
                  31.72 GB
                • val2014.zip
                  37.91 GB
              • VQA_Input-Questions/
                • Questions_Test_mscoco.zip
                  37.94 GB
                • Questions_Train_mscoco.zip
                  37.96 GB
                • Questions_Val_mscoco.zip
                  37.97 GB
Ensemble De Données De Réponses Visuelles Aux Questions Du TDIUC | Ensembles de données | HyperAI