Explanatory Visual Question Answering
Le Questionnement Visuel Explicatif (QVE) est une tâche avancée dans le domaine de la vision par ordinateur qui vise à répondre à des questions visuelles et à générer des explications multimodales pour révéler le processus de raisonnement. Cette tâche nécessite non seulement une compréhension précise du contenu des images, mais aussi l'intégration d'éléments de langage naturel et visuels pour exprimer de manière exhaustive la logique du raisonnement, ce qui améliore la transparence et l'interprétabilité du modèle. Elle présente une valeur d'application significative.