HyperAIHyperAI
vor 2 Monaten

UniGeo: Vereinheitlichung geometrischer logischen Schlussfolgerungen durch Umformulierung mathematischer Ausdrücke

Jiaqi Chen; Tong Li; Jinghui Qin; Pan Lu; Liang Lin; Chongyu Chen; Xiaodan Liang
UniGeo: Vereinheitlichung geometrischer logischen Schlussfolgerungen durch Umformulierung mathematischer Ausdrücke
Abstract

Die Lösung geometrischer Probleme ist ein weit anerkanntes Testfeld zur Bewertung der hochstufigen multimodalen Schließfähigkeit tiefster Modelle. In den meisten bisherigen Arbeiten werden die beiden Hauptgeometrieaufgaben – Berechnungen und Beweise – in der Regel als zwei spezifische Aufgaben behandelt, was es einem tiefen Modell erschwert, seine Schließfähigkeiten bei mehreren Mathematikaufgaben zu vereinheitlichen. Im Wesentlichen haben diese beiden Aufgaben jedoch ähnliche Problemrepräsentationen und überlappendes mathematisches Wissen, das das Verständnis und die Schließfähigkeit eines tiefen Modells bei beiden Aufgaben verbessern kann.Daher erstellen wir eine groß angelegte vereinte Benchmark für geometrische Probleme, UniGeo, die 4.998 Berechnungsprobleme und 9.543 Beweisprobleme enthält. Jedes Beweisproblem ist mit einem mehrschrittigen Beweis versehen, der Begründungen und mathematische Ausdrücke umfasst. Der Beweis kann leicht in eine Beweissequenz umformuliert werden, die die gleichen Formate wie die annotierte Programmsequenz für Berechnungsprobleme teilt. Natürlich präsentieren wir auch einen vereinten mehrfach-aufgabenbasierten Geometrischen Transformer-Framework, den Geoformer, der dazu dient, Berechnungs- und Beweisaufgaben gleichzeitig im Format der Sequenzgenerierung zu lösen. Dies zeigt letztendlich, dass die Schließfähigkeit bei beiden Aufgaben durch eine vereinte Formulierung verbessert werden kann.Darüber hinaus schlagen wir eine Methode des vorgeschalteten Trainings mathematischer Ausdrücke (Mathematical Expression Pretraining, MEP) vor, deren Ziel es ist, die mathematischen Ausdrücke in der Lösung des Problems vorherzusagen und damit das Geoformer-Modell zu verbessern. Experimente mit UniGeo zeigen, dass unser vorgeschlagener Geoformer durch Überlegenheit gegenüber dem aufgabenspezifischen Modell NGS sowohl bei Berechnungs- als auch bei Beweisaufgaben Spitzenleistungen erzielt: Er erreicht eine Genauigkeit von über 5,6 % und 3,2 % höher als NGS bei diesen beiden Aufgabentypen.