Multi-View Reasoning: Konsistente contrastive Lernverfahren für mathematische Textaufgaben

Ein mathematischer Textaufgabenlöser erfordert sowohl präzise relationale Schlussfolgerungen über Größen in der Textbeschreibung als auch zuverlässige Generierung verschiedenartiger Gleichungen. Aktuelle Ansätze auf Basis von Sequenz-zu-Baum- oder Relationsextraktionsmethoden betrachten dieses Problem lediglich aus einer festen Perspektive und stoßen bei der gleichzeitigen Bewältigung komplexer Semantik und vielfältiger Gleichungen an ihre Grenzen. Menschen lösen dagegen Aufgaben naturgemäß mit zwei konsistenten Denkansätzen: top-down und bottom-up – ähnlich wie mathematische Gleichungen in mehreren äquivalenten Formen dargestellt werden können: in Prä- und Postordnung. Wir schlagen ein mehrperspektivisches, konsistentes kontrastives Lernen vor, um eine umfassendere Abbildung von Semantik auf Gleichungen zu erreichen. Der gesamte Prozess wird in zwei voneinander unabhängige, aber konsistente Perspektiven zerlegt: top-down-Zerlegung und bottom-up-Konstruktion. Die beiden Denkansätze werden auf mehreren Granularitätsstufen auf Konsistenz hin ausgerichtet, was die globale Generierung und präzise Schlussfolgerung verbessert. Experimente an mehreren Datensätzen in zwei Sprachen zeigen, dass unser Ansatz die bestehenden Baselines erheblich übertrifft, insbesondere bei komplexen Aufgaben. Zudem belegen wir, dass nach der konsistenten Ausrichtung die Mehrperspektivität die Stärken beider Ansätze aufnehmen und vielfältigere, den mathematischen Gesetzen entsprechende Ergebnisse erzeugen kann.