Command Palette
Search for a command to run...
Ensemble De Données De Réponses Aux Questions Ouvertes VQA (v2.0)
Date
Taille
URL de publication
URL de l'article
Licence
Autre
VQA (v2.0), dont le nom complet est Visual Question Answering (v2.0), est un ensemble de données de questions-réponses ouvertes et annotées manuellement sur les images. Répondre à ces questions nécessite une certaine compréhension des images, du langage et du bon sens.
Exemple d'image :

L'ensemble de données comprend :
- 265 016 images (provenant de jeux de données COCO et de scènes abstraites)
- Le nombre de questions par image est supérieur ou égal à 3 (moyenne 5,4 questions)
- Chaque question contient 10 vérités fondamentales
- Chaque question a 3 réponses plausibles (mais pas nécessairement correctes)
- Mesures d'évaluation automatique
L'ensemble de données VQA a été publié pour la première fois en octobre 2015 et VQA v2.0 a été publié en avril 2017.Cet ensemble de données est la version v2.0.Par rapport à VQA v1.0, v2.0 complète chaque question avec des images pour minimiser les biais linguistiques.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.