Une Stratégie de Déchiffrement d'Arbre d'Expressions pour la Génération d'Équations Mathématiques

La génération d'équations mathématiques à partir du langage naturel nécessite une compréhension précise des relations entre les expressions mathématiques. Les approches existantes peuvent être classées de manière générale en deux catégories : la génération au niveau des jetons et la génération au niveau des expressions. La première traite les équations comme un langage mathématique, générant séquentiellement des jetons mathématiques. Les méthodes au niveau des expressions génèrent quant à elles chaque expression une par une. Cependant, chaque expression représente une étape de résolution, et il existe naturellement des relations parallèles ou dépendantes entre ces étapes, qui sont ignorées par les méthodes séquentielles actuelles. Par conséquent, nous intégrons une structure arborescente dans la génération au niveau des expressions et proposons une stratégie de décodage basée sur l'arbre d'expressions. Pour générer un arbre dont les nœuds sont des expressions, nous utilisons une stratégie de décodage parallèle couche par couche : nous décodons plusieurs expressions indépendantes (nœuds feuilles) en parallèle à chaque couche et répétons le décodage parallèle couche après couche pour générer séquentiellement ces expressions de nœuds parents qui dépendent d'autres. De plus, un algorithme d'appariement biparti est adopté pour aligner plusieurs prédictions avec les annotations pour chaque couche. Les expériences montrent que notre méthode surpassent les autres méthodes de référence, en particulier pour les équations aux structures complexes.