Ensemble De Données De Référence Pour Le Raisonnement Mathématique Visuel Standard We-Math2.0
Date
Taille
URL de publication
URL de l'article
Licence
非商业用途
*Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.
We-Math2.0-Standard est un ensemble de données standard pour le raisonnement mathématique visuel publié par l'Université des postes et télécommunications de Pékin, Tencent et l'Université Tsinghua en 2025. Les résultats de l'article associé sont "WE-MATH 2.0 : un système de livre de mathématiques polyvalent pour encourager le raisonnement mathématique visuel", vise à fournir une base d'évaluation diagnostiquable, explicable et comparable.
Cet ensemble de données construit un espace d'étiquetage unifié autour de 1 819 principes de connaissance précisément définis, annotant explicitement chaque question avec le principe et le sélectionnant rigoureusement. Il permet ainsi une couverture globale large et équilibrée, renforçant notamment les sous-domaines mathématiques et les types de questions jusque-là sous-représentés. L'ensemble de données adopte une conception à double expansion :
- Premièrement, plusieurs images par question sont utilisées pour tester l’intégration et l’alignement des preuves visuelles multi-sources ;
- Deuxièmement, des questions multiples par image sont utilisées pour tester le transfert multi-principes et la flexibilité conceptuelle dans le même contexte visuel.
Chaque exemple se compose d'une image et d'une amorce de texte, et est accompagné d'annotations des principes de connaissance et des réponses standard sur lesquels s'appuie la question.
