HyperAI

Visual Commonsense Tests

Les tests de sens commun visuel sont une sous-tâche dans le domaine du traitement automatique des langues, visant à évaluer la compréhension du modèle en matière de sens commun dans les scènes visuelles. Cette tâche consiste à prédire cinq types d'attributs (couleur, forme, matériau, taille et co-occurrence visuelle) pour plus de 5 000 sujets, dans le but d'améliorer les capacités de raisonnement et de jugement du modèle dans des environnements visuels complexes, et de renforcer sa robustesse et sa généralisation dans les applications réelles.