HyperAIHyperAI

Ensemble De Données De Réponses Aux Questions Ouvertes VQA (v2.0)

Date

il y a 3 ans

Taille

12.01 GB

URL de publication

visualqa.org

URL de l'article

arxiv.org

Licence

其他

VQA (v2.0), dont le nom complet est Visual Question Answering (v2.0), est un ensemble de données de questions-réponses ouvertes et annotées manuellement sur les images. Répondre à ces questions nécessite une certaine compréhension des images, du langage et du bon sens.

Exemple d'image :

L'ensemble de données comprend :

  • 265 016 images (provenant de jeux de données COCO et de scènes abstraites)
  • Le nombre de questions par image est supérieur ou égal à 3 (moyenne 5,4 questions)
  • Chaque question contient 10 vérités fondamentales
  • Chaque question a 3 réponses plausibles (mais pas nécessairement correctes)
  • Mesures d'évaluation automatique

L'ensemble de données VQA a été publié pour la première fois en octobre 2015 et VQA v2.0 a été publié en avril 2017.Cet ensemble de données est la version v2.0.Par rapport à VQA v1.0, v2.0 complète chaque question avec des images pour minimiser les biais linguistiques.

Réponse visuelle aux questions (VQA).torrent
Partage 2Téléchargement 0Terminés 700Téléchargements totaux 1,587
  • Visual_Question_Answering_(VQA)/
    • README.md
      1.41 KB
    • README.txt
      2.81 KB
      • data/
        • 1GB_test.file
          1000 MB
        • Annotations_Binary_Train2017_abstract_v002.zip
          1000.41 MB
        • Annotations_Binary_Val2017_abstract_v002.zip
          1000.65 MB
        • Annotations_Train_abstract_v002.zip
          1003.18 MB
        • Annotations_Val_abstract_v002.zip
          1004.44 MB
        • Questions_Binary_Train2017_abstract_v002.zip
          1004.74 MB
        • Questions_Binary_Val2017_abstract_v002.zip
          1004.89 MB
        • Questions_Test_abstract_v002.zip
          1009.08 MB
        • Questions_Train_abstract_v002.zip
          1013.48 MB
        • Questions_Val_abstract_v002.zip
          1015.61 MB
        • scene_img_abstract_v002_binary_train2017.zip
          3.77 GB
        • scene_img_abstract_v002_binary_val2017.zip
          5.21 GB
        • scene_img_abstract_v002_test2015.zip
          7.9 GB
        • scene_img_abstract_v002_train2015.zip
          10.61 GB
        • scene_img_abstract_v002_val2015.zip
          11.96 GB
        • v2_Annotations_Train_mscoco.zip
          11.98 GB
        • v2_Annotations_Val_mscoco.zip
          11.99 GB
        • v2_Complementary_Pairs_Train_mscoco.zip
          11.99 GB
        • v2_Complementary_Pairs_Val_mscoco.zip
          11.99 GB
        • v2_Questions_Test_mscoco.zip
          12 GB
        • v2_Questions_Train_mscoco.zip
          12.01 GB
        • v2_Questions_Val_mscoco.zip
          12.01 GB
Ensemble De Données De Réponses Aux Questions Ouvertes VQA (v2.0) | Ensembles de données | HyperAI