Command Palette
Search for a command to run...
Ensemble De Données De Réponses Aux Questions Ouvertes VQA (v2.0)
Date
Size
Publish URL
Paper URL
License
Other
VQA (v2.0), dont le nom complet est Visual Question Answering (v2.0), est un ensemble de données de questions-réponses ouvertes et annotées manuellement sur les images. Répondre à ces questions nécessite une certaine compréhension des images, du langage et du bon sens.
Exemple d'image :

L'ensemble de données comprend :
- 265 016 images (provenant de jeux de données COCO et de scènes abstraites)
- Le nombre de questions par image est supérieur ou égal à 3 (moyenne 5,4 questions)
- Chaque question contient 10 vérités fondamentales
- Chaque question a 3 réponses plausibles (mais pas nécessairement correctes)
- Mesures d'évaluation automatique
L'ensemble de données VQA a été publié pour la première fois en octobre 2015 et VQA v2.0 a été publié en avril 2017.Cet ensemble de données est la version v2.0.Par rapport à VQA v1.0, v2.0 complète chaque question avec des images pour minimiser les biais linguistiques.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.