HyperAIHyperAI

Command Palette

Search for a command to run...

VizWiz-Datensatz Für Visuelle Fragen Und Antworten Für Blinde

Date

vor 3 Jahren

Size

17.65 GB

Organization

Universität von Texas in Austin

Publish URL

vizwiz.org

Paper URL

arxiv.org

License

CC BY 4.0

Featured Image

VizWiz-VQA (Visual Question Answering) ist ein Bilddatensatz zur visuellen Frage-und-Antwort-Funktion für Blinde. Blinde Benutzer verwenden die VizWiz-Software, um ein Foto aufzunehmen und eine mündliche Frage zu dem Foto sowie 10 Crowdsourcing-Antworten auf die Frage aufzuzeichnen. Dieser Datensatz wird verwendet, um die folgenden zwei Probleme zu lösen: Das eine besteht darin, die Antwort auf eine visuelle Frage vorherzusagen, und das andere besteht darin, festzustellen, ob eine visuelle Frage beantwortet werden kann. Ziel dieses Datensatzes ist die Untersuchung allgemeinerer Algorithmen, die blinden Menschen bei der Überwindung von Hindernissen im Leben helfen sollen.

Der Datensatz enthält (neueste Version 2020):

  • 20.523 Paare aus Trainingsbildern/Fragen
  • 205.230 für Trainingsantworten/Antwortsicherheit
  • 4319 Verifizierungsbilder/-fragen
  • 43.190 Paare verifizierter Antworten/Antwortsicherheit
  • 8.000 Testbild-/Fragenpaare
VisWiz.torrent
Seeding 1Downloading 0Completed 244Total Downloads 398
  • VisWiz/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
        • API.zip
          176.98 MB
        • Annotations.zip
          178.55 MB
        • test.zip
          3.88 GB
        • train.zip
          14.4 GB
        • val.zip
          17.65 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp