Command Palette
Search for a command to run...
Ensemble De Données De Réponses Visuelles Aux Questions Du TDIUC
Date
Size
Publish URL
Paper URL

TDIUC, dont le nom complet est Task Directed Image Understanding Challenge, est un ensemble de données de questions-réponses visuelles. L'ensemble de données comprend 1,6 million de questions et 170 000 images provenant des ensembles de données MS COCO et Visual Genome ; Les paires image-question sont divisées en 12 catégories et 4 matrices d'évaluation supplémentaires pour évaluer la robustesse du modèle et la capacité de raisonnement.
Statistiques TDIUC :
- 12 types de questions différents (regroupés par tâches de base, y compris certaines questions « absurdes »)
- 167 437 images (de MS-COCO et Visual Genome)
- 1,65 million de paires questions-réponses (provenant de 3 sources)
- 4 nouvelles mesures d'évaluation (conçues pour compenser les biais)
- 6 nouveaux paramètres expérimentaux (répondant à des questions clés sur les algorithmes VQA)
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.