Ensemble De Données De Raisonnement Mathématique NaturalProofs
Date
Taille
URL de publication
L'ensemble de données NaturalProofs est un corpus multi-domaines permettant d'étudier le raisonnement mathématique en langage naturel. Il a été publié en 2021 par des chercheurs de l’Université de Washington, de l’Institut Allen pour l’intelligence artificielle et de l’Université de New York. Les résultats de l’article connexe sont «NaturalProofs : démonstration de théorèmes mathématiques en langage naturel".
Il contient environ 30 000 énoncés et preuves de théorèmes, 15 000 définitions et 2 000 pages supplémentaires (par exemple, axiomes, corollaires), tous écrits en langage mathématique naturel. L'ensemble de données NaturalProofs couvre une large gamme de données provenant de ProofWiki, des données détaillées du projet Stacks et des données à faibles ressources provenant de manuels de mathématiques. NaturalProofs unifie ces sources sous un schéma commun et les rend disponibles en tant que ressource publique pour faire progresser les tâches impliquant des mathématiques informelles. Cet ensemble de données fournit une ressource riche pour l’étude du raisonnement mathématique et contribue à promouvoir le développement du raisonnement mathématique dans les domaines du traitement du langage naturel et de l’apprentissage automatique.