HyperAI

VQA (v2.0) Offener Fragen-Antwort-Datensatz

VQA (v2.0), dessen vollständiger Name Visual Question Answering (v2.0) lautet, ist ein manuell annotierter, offener Frage-Antwort-Datensatz zu Bildern. Die Beantwortung dieser Fragen erfordert ein gewisses Verständnis von Bildern, Sprache und gesundem Menschenverstand.

Beispielbild:

Der Datensatz umfasst:

  • 265.016 Bilder (aus COCO- und abstrakten Szenen-Datensätzen)
  • Die Anzahl der Fragen pro Bild ist größer oder gleich 3 (durchschnittlich 5,4 Fragen)
  • Jede Frage enthält 10 Grundwahrheiten
  • Jede Frage hat 3 plausible (aber nicht unbedingt richtige) Antworten
  • Automatische Bewertungsmetriken

Der VQA-Datensatz wurde erstmals im Oktober 2015 veröffentlicht und VQA v2.0 wurde im April 2017 veröffentlicht.Dieser Datensatz ist Version v2.0.Im Vergleich zu VQA v1.0 ergänzt v2.0 jede Frage mit Bildern, um Sprachverzerrungen zu minimieren.

Visual_Question_Answering_(VQA).torrent
Seeding 1Herunterladen 1Abgeschlossen 570Gesamtdownloads 1,327
  • Visual_Question_Answering_(VQA)/
    • README.md
      1.41 KB
    • README.txt
      2.81 KB
      • data/
        • 1GB_test.file
          1000 MB
        • Annotations_Binary_Train2017_abstract_v002.zip
          1000.41 MB
        • Annotations_Binary_Val2017_abstract_v002.zip
          1000.65 MB
        • Annotations_Train_abstract_v002.zip
          1003.18 MB
        • Annotations_Val_abstract_v002.zip
          1004.44 MB
        • Questions_Binary_Train2017_abstract_v002.zip
          1004.74 MB
        • Questions_Binary_Val2017_abstract_v002.zip
          1004.89 MB
        • Questions_Test_abstract_v002.zip
          1009.08 MB
        • Questions_Train_abstract_v002.zip
          1013.48 MB
        • Questions_Val_abstract_v002.zip
          1015.61 MB
        • scene_img_abstract_v002_binary_train2017.zip
          3.77 GB
        • scene_img_abstract_v002_binary_val2017.zip
          5.21 GB
        • scene_img_abstract_v002_test2015.zip
          7.9 GB
        • scene_img_abstract_v002_train2015.zip
          10.61 GB
        • scene_img_abstract_v002_val2015.zip
          11.96 GB
        • v2_Annotations_Train_mscoco.zip
          11.98 GB
        • v2_Annotations_Val_mscoco.zip
          11.99 GB
        • v2_Complementary_Pairs_Train_mscoco.zip
          11.99 GB
        • v2_Complementary_Pairs_Val_mscoco.zip
          11.99 GB
        • v2_Questions_Test_mscoco.zip
          12 GB
        • v2_Questions_Train_mscoco.zip
          12.01 GB
        • v2_Questions_Val_mscoco.zip
          12.01 GB