Dicht Annotierter Datensatz Des Visuellen Genoms
Datum
vor 2 Jahren
Größe
15.31 GB
Veröffentlichungs-URL
Lizenz
CC BY 4.0
Kategorien

Der Visual Genome Dataset ist ein Datensatz, der Sprache und Sehen durch Crowdsourcing-basierte, dichte Bildannotation verbindet, einschließlich Visual Question Answering-Daten in einer Multiple-Choice-Umgebung.
Der Datensatz besteht aus 1,7 Millionen QA-Paaren für 101.174 MSCOCO-Bilder mit durchschnittlich 17 Fragen pro Bild.
Im Vergleich zum Visual Question Answering-Datensatz weist der Visual Genome-Datensatz eine ausgewogenere Verteilung von sechs Fragetypen auf: Was, Wo, Wann, Wer, Warum und Wie. Darüber hinaus präsentiert Visual Genome 108.000 Bilder, die dicht mit Objekten, Attributen und Beziehungen versehen sind.
Visual_Genome_Dataset.torrent
Seeding 2Herunterladen 1Abgeschlossen 591Gesamtdownloads 865