HyperAIHyperAI

Command Palette

Search for a command to run...

Visual7W-Datensatz Für Visuelle Fragen Und Antworten

Date

vor 3 Jahren

Size

1.76 GB

Organization

Stanford Universität

Publish URL

ai.stanford.edu

Paper URL

arxiv.org

License

Other

Featured Image

Visual7W ist ein Datensatz zum Verständnis von Bildinhalten. Es führt visuelle Frage- und Antwortaufgaben durch, indem es Bildbereiche im Text und ihre Assoziationen beschreibt. Der Datensatz enthält nicht nur das Bild selbst, sondern auch Fragen und Antworten zum Inhalt der Bildregion.

Visual7W ist eine Teilmenge des Visual Genome-Datensatzes und enthält 47.300 COCO-Datensatzbilder, 327.929 Frage-Antwort-Paare, 1.311.756 von Menschen erstellte Multiple-Choice-Fragen und 561.459 Objektbegründungen, die 36.579 Kategorien abdecken.

Die Fragen von Visual7W bestehen hauptsächlich aus Was, Wo, Wie, Wann, Wer, Warum und Welchem. Die Fragen sind im Multiple-Choice-Format und jede Frage hat vier mögliche Antworten.

Visual7W.torrent
Seeding 2Downloading 0Completed 567Total Downloads 719
  • Visual7W/
    • README.md
      1.34 KB
    • README.txt
      2.68 KB
      • data/
        • dataset_v7w_grounding_annotations.zip
          7.07 MB
        • dataset_v7w_pointing.zip
          18.56 MB
        • dataset_v7w_telling.zip
          24.2 MB
        • visual7w-toolkit
          24.39 MB
        • visual7w_images.zip
          1.76 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp