Lernen des deduktiven Schließens: Mathematische Textaufgabenlösen als komplexe Relationsextraktion

Das Lösen von mathematischen Textaufgaben erfordert deduktives Schließen über die Größenangaben im Text. Verschiedene neuere Forschungsansätze stützen sich hauptsächlich auf Sequenz-zu-Sequenz- oder Sequenz-zu-Baum-Modelle, um mathematische Ausdrücke zu generieren, ohne explizit Beziehungsreasoning zwischen den Größen im gegebenen Kontext durchzuführen. Obwohl diese Ansätze empirisch wirksam sind, liefern sie typischerweise keine Erklärungen für die generierten Ausdrücke. In dieser Arbeit betrachten wir die Aufgabe als ein komplexes Relationsextraktionsproblem und stellen einen neuen Ansatz vor, der erklärbare deduktive Schlussfolgerungsschritte vorschlägt, um schrittweise die Zielausdrücke aufzubauen, wobei jeder Schritt eine primitive Operation zwischen zwei Größen beinhaltet, die deren Beziehung definieren. In umfangreichen Experimenten an vier Standard-Datensätzen zeigen wir, dass das vorgeschlagene Modell bestehende starke Baselines erheblich übertrifft. Darüber hinaus demonstrieren wir, dass das deduktive Verfahren nicht nur nachvollziehbarere Schritte bietet, sondern auch eine genauere Vorhersage für Fragen ermöglicht, die komplexeres Schließen erfordern.