Ensemble De Données De Réponses Aux Questions Ouvertes VQA (v2.0)
Date
il y a 3 ans
Taille
12.01 GB
URL de publication
Licence
其他
VQA (v2.0), dont le nom complet est Visual Question Answering (v2.0), est un ensemble de données de questions-réponses ouvertes et annotées manuellement sur les images. Répondre à ces questions nécessite une certaine compréhension des images, du langage et du bon sens.
Exemple d'image :

L'ensemble de données comprend :
- 265 016 images (provenant de jeux de données COCO et de scènes abstraites)
- Le nombre de questions par image est supérieur ou égal à 3 (moyenne 5,4 questions)
- Chaque question contient 10 vérités fondamentales
- Chaque question a 3 réponses plausibles (mais pas nécessairement correctes)
- Mesures d'évaluation automatique
L'ensemble de données VQA a été publié pour la première fois en octobre 2015 et VQA v2.0 a été publié en avril 2017.Cet ensemble de données est la version v2.0.Par rapport à VQA v1.0, v2.0 complète chaque question avec des images pour minimiser les biais linguistiques.
Visual_Question_Answering_(VQA).torrent
Partage 1Téléchargement 1Terminés 619Téléchargements totaux 1,419