Eine Entschlüsselungsstrategie für Ausdrucksbäume zur Generierung mathematischer Gleichungen

Die Generierung mathematischer Gleichungen aus natürlicher Sprache erfordert ein genaues Verständnis der Beziehungen zwischen mathematischen Ausdrücken. Bestehende Ansätze lassen sich grob in token-basierte und expression-basierte Generierungsverfahren einteilen. Die erstgenannten behandeln Gleichungen als mathematische Sprache und generieren sequenziell mathematische Tokens. Expression-basierte Methoden generieren hingegen jeden Ausdruck einzeln. Jeder Ausdruck repräsentiert jedoch einen Lösungsschritt, und es bestehen natürliche parallele oder abhängige Beziehungen zwischen diesen Schritten, die von aktuellen sequenziellen Methoden übersehen werden. Daher integrieren wir eine Baumstruktur in die expression-basierte Generierung und befürworten eine Strategie zur Dekodierung von Ausdrucksbäumen. Um einen Baum mit Ausdrücken als Knoten zu generieren, verwenden wir eine schichtweise parallele Dekodierstrategie: Wir dekodieren mehrere unabhängige Ausdrücke (Blattknoten) parallel in jeder Schicht und wiederholen die parallele Dekodierung schichtweise, um diese Elternknotenausdrücke sequenziell zu generieren, die von anderen abhängig sind. Darüber hinaus wird ein bipartiter Zuordnungsalgorithmus verwendet, um mehrere Vorhersagen mit den Annotationen für jede Schicht zu alignieren. Experimente zeigen, dass unsere Methode andere Baselines übertrifft, insbesondere bei Gleichungen mit komplexer Struktur.