HyperAI

Ensemble De Données De Dialogue D'images VisDial

Date

il y a 3 ans

Taille

1.86 GB

Organisation

URL de publication

visualdialog.org

Licence

CC BY 4.0

特色图像

VisDial, nom complet de Visual Dialog, est un ensemble de données contenant des problèmes d'annotation manuelle basés sur des images de l'ensemble de données MS COCO.

L'ensemble de données a été développé en demandant à deux sujets de discuter d'une image sur Amazon Mechanical Turk. L’un d’eux agit comme celui qui pose la question et l’autre comme celui qui répond. L'interrogateur ne peut voir que la description textuelle de l'image (c'est-à-dire la légende de l'image de l'ensemble de données MS COCO), et l'image d'origine n'est pas visible pour l'interrogateur. Leur tâche était de poser des questions autour de cette image afin de « mieux imaginer la scène ». Le répondant voit l’image, la légende et répond à la question posée par l’interrogateur. Les deux peuvent poursuivre la conversation en posant et en répondant à des questions, jusqu'à 10 tours.

VisDial v1.0 comprend :

  • Ensemble d'entraînement : 1 23 287 images, 10 tours de dialogue par image ;
  • Ensemble de validation : 2 064 images, 10 tours de dialogue par image ;
  • Ensemble de test : 8 000 images, 1 tour de dialogue par image.
VisDial.torrent
Partage 1Téléchargement 1Terminés 446Téléchargements totaux 542
  • VisDial/
    • README.md
      1.58 KB
    • README.txt
      3.15 KB
      • data/
        • VisualDialog_test2018.zip
          1.2 GB
        • VisualDialog_val2018.zip
          1.51 GB
        • visdial_1.0_test.zip
          1.51 GB
        • visdial_1.0_train.zip
          1.85 GB
        • visdial_1.0_val.zip
          1.86 GB