HyperAI

Visual7W-Datensatz Für Visuelle Fragen Und Antworten

Datum

vor 3 Jahren

Größe

1.76 GB

Organisation

Stanford Universität

Veröffentlichungs-URL

ai.stanford.edu

Lizenz

其他

特色图像

Visual7W ist ein Datensatz zum Verständnis von Bildinhalten. Es führt visuelle Frage- und Antwortaufgaben durch, indem es Bildbereiche im Text und ihre Assoziationen beschreibt. Der Datensatz enthält nicht nur das Bild selbst, sondern auch Fragen und Antworten zum Inhalt der Bildregion.

Visual7W ist eine Teilmenge des Visual Genome-Datensatzes und enthält 47.300 COCO-Datensatzbilder, 327.929 Frage-Antwort-Paare, 1.311.756 von Menschen erstellte Multiple-Choice-Fragen und 561.459 Objektbegründungen, die 36.579 Kategorien abdecken.

Die Fragen von Visual7W bestehen hauptsächlich aus Was, Wo, Wie, Wann, Wer, Warum und Welchem. Die Fragen sind im Multiple-Choice-Format und jede Frage hat vier mögliche Antworten.

Visual7W.torrent
Seeding 1Herunterladen 1Abgeschlossen 397Gesamtdownloads 510
  • Visual7W/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • dataset_v7w_grounding_annotations.zip
          7.07 MB
        • dataset_v7w_pointing.zip
          18.56 MB
        • dataset_v7w_telling.zip
          24.2 MB
        • visual7w-toolkit
          24.39 MB
        • visual7w_images.zip
          1.76 GB