HyperAIHyperAI
il y a 2 mois

TopicEq : Un modèle conjoint de sujets et d'équations mathématiques pour les textes scientifiques

Michihiro Yasunaga; John Lafferty
TopicEq : Un modèle conjoint de sujets et d'équations mathématiques pour les textes scientifiques
Résumé

Les documents scientifiques s'appuient à la fois sur les mathématiques et le texte pour communiquer des idées. Inspirés par la correspondance thématique observée entre les équations mathématiques et les contextes lexicaux dans les textes scientifiques, nous proposons un nouveau modèle de sujet qui génère conjointement des équations mathématiques et leur environnement textuel (TopicEq). En utilisant une extension du modèle de sujets corrélés, le contexte est généré à partir d'un mélange de sujets latents, tandis que l'équation est générée par un réseau neuronal récurrent (RNN) dépendant des activations des sujets latents. Pour expérimenter ce modèle, nous avons créé un corpus de 400 000 paires équation-contexte extraites d'une variété d'articles scientifiques provenant d'arXiv, et ajusté le modèle en utilisant une approche d'autoencodeur variationnel. Les résultats expérimentaux montrent que ce modèle conjoint surpasse significativement les modèles de sujets et les modèles d'équations existants pour les textes scientifiques. De plus, nous montrons qualitativement que le modèle capture efficacement la relation entre les sujets et les mathématiques, permettant ainsi des applications novatrices telles que la génération d'équations sensibles aux sujets, l'inférence de sujets à partir des équations, et l'alignement sensible aux sujets des symboles mathématiques et des mots.

TopicEq : Un modèle conjoint de sujets et d'équations mathématiques pour les textes scientifiques | Articles de recherche récents | HyperAI