Datum

vor 4 Jahren

Größe

1.86 GB

Organisation

Veröffentlichungs-URL

visualdialog.org

Paper-URL

arxiv.org

Lizenz

CC BY 4.0

Tags

Multimodal

Tiefes Lernen

Visuelle Fragebeantwortung

Bildverstehen

VisDial, der vollständige Name von Visual Dialog, ist ein Datensatz, der manuelle Annotationsprobleme basierend auf Bildern aus dem MS COCO-Datensatz enthält. Der Datensatz wurde entwickelt, indem zwei Probanden über ein Bild auf Amazon Mechanical Turk chatten mussten. Einer von ihnen fungiert als Fragesteller und der andere als Antwortender. Der Fragesteller kann nur die Textbeschreibung des Bildes sehen (also die Bildunterschrift aus dem MS COCO-Datensatz), das Originalbild ist für den Fragesteller nicht sichtbar. Ihre Aufgabe bestand darin, Fragen zu diesem Bild zu stellen, um sich „die Szene besser vorstellen zu können“. Der Befragte sieht das Bild, die Bildunterschrift und beantwortet die vom Fragesteller gestellte Frage. Die beiden können das Gespräch fortsetzen, indem sie Fragen stellen und beantworten, bis zu 10 Runden. VisDial v1.0 enthält:

Trainingssatz: 123.287 Bilder, 10 Dialogrunden pro Bild;
Validierungssatz: 2.064 Bilder, 10 Dialogrunden pro Bild;
Testsatz: 8.000 Bilder, 1 Dialogrunde pro Bild.

VisDial.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 620Gesamtdownloads 794

VisDial/
- README.md
  1.58 KB
- README.txt
  3.15 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 4 Jahren

Größe

1.86 GB

Organisation

Veröffentlichungs-URL

visualdialog.org

Paper-URL

arxiv.org

Lizenz

CC BY 4.0

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

vor 2 Monaten

Fahrzeuge OpenImages Fahrzeugbilddatensatz

vor 5 Monaten

CCTV-Datensatz Zur Sturzerkennung

vor 5 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 8 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

VisDial Bilddialog-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

VisDial Bilddialog-Datensatz

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Fahrzeuge OpenImages Fahrzeugbilddatensatz

CCTV-Datensatz Zur Sturzerkennung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

VisDial Bilddialog-Datensatz

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Fahrzeuge OpenImages Fahrzeugbilddatensatz

CCTV-Datensatz Zur Sturzerkennung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Fahrzeuge OpenImages Fahrzeugbilddatensatz

CCTV-Datensatz Zur Sturzerkennung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Fahrzeuge OpenImages Fahrzeugbilddatensatz

CCTV-Datensatz Zur Sturzerkennung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen