ATHENA: Mathematische Schlussfolgerung mit Gedankenerweiterung

Die Lösung mathematischer Textaufgaben hängt entscheidend davon ab, wie diese Aufgaben formuliert werden – also aus welcher Perspektive Modelle menschliche sprachliche Ausdrücke interpretieren. Reale Anwendungsszenarien setzen solche Methoden noch stärker voraus, da dieselben mathematischen Operationen je nach Kontext unterschiedlich angewendet werden können. Frühere Ansätze beschränken die verfügbaren Denkprozesse durch begrenzte Vorhersagestrategien, ohne deren Bedeutung für den Aufbau mathematischen Wissens angemessen zu berücksichtigen. Wir stellen die Attention-based THought Expansion Network Architecture (ATHENA) vor, um die Herausforderungen realweltbezogener Praxis zu bewältigen, indem wir die menschliche Denkexpansion mechanistisch nachahmen, in Form von neuronalen Netzwerkkaskaden. Eine Denkexpansion generiert iterativ Kandidaten, die Gedanken möglicher mathematischer Ausdrücke enthalten, die sich aus dem vorherigen Schritt ergeben, und erzeugt sinnvolle Gedanken, indem sie valide Pfade zum Ziel auswählt. Unsere Experimente zeigen, dass ATHENA eine neue state-of-the-art-Leistung erreicht und sich gegenüber dem idealen Modell als überzeugend erweist, selbst wenn die Informationsdichte in den Trainingsbeispielen eingeschränkt ist.