Command Palette
Search for a command to run...
Ensemble De Données De Réponses Visuelles Aux Questions Du TDIUC
Date
Taille
URL de publication
URL du document
Balises

TDIUC, dont le nom complet est Task Directed Image Understanding Challenge, est un ensemble de données de questions-réponses visuelles. L'ensemble de données comprend 1,6 million de questions et 170 000 images provenant des ensembles de données MS COCO et Visual Genome ; Les paires image-question sont divisées en 12 catégories et 4 matrices d'évaluation supplémentaires pour évaluer la robustesse du modèle et la capacité de raisonnement.
Statistiques TDIUC :
- 12 types de questions différents (regroupés par tâches de base, y compris certaines questions « absurdes »)
- 167 437 images (de MS-COCO et Visual Genome)
- 1,65 million de paires questions-réponses (provenant de 3 sources)
- 4 nouvelles mesures d'évaluation (conçues pour compenser les biais)
- 6 nouveaux paramètres expérimentaux (répondant à des questions clés sur les algorithmes VQA)
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.