Command Palette
Search for a command to run...
Dicht Annotierter Datensatz Des Visuellen Genoms
Date
Size
Publish URL
Paper URL
License
CC BY 4.0

Der Visual Genome Dataset ist ein Datensatz, der Sprache und Sehen durch Crowdsourcing-basierte, dichte Bildannotation verbindet, einschließlich Visual Question Answering-Daten in einer Multiple-Choice-Umgebung.
Der Datensatz besteht aus 1,7 Millionen QA-Paaren für 101.174 MSCOCO-Bilder mit durchschnittlich 17 Fragen pro Bild.
Im Vergleich zum Visual Question Answering-Datensatz weist der Visual Genome-Datensatz eine ausgewogenere Verteilung von sechs Fragetypen auf: Was, Wo, Wann, Wer, Warum und Wie. Darüber hinaus präsentiert Visual Genome 108.000 Bilder, die dicht mit Objekten, Attributen und Beziehungen versehen sind.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.