HyperAIHyperAI

Command Palette

Search for a command to run...

UniGeo: Vereinheitlichung geometrischer logischen Schlussfolgerungen durch Umformulierung mathematischer Ausdrücke

Jiaqi Chen Tong Li Jinghui Qin Pan Lu Liang Lin Chongyu Chen Xiaodan Liang

Zusammenfassung

Die Lösung geometrischer Probleme ist ein weit anerkanntes Testfeld zur Bewertung der hochstufigen multimodalen Schließfähigkeit tiefster Modelle. In den meisten bisherigen Arbeiten werden die beiden Hauptgeometrieaufgaben – Berechnungen und Beweise – in der Regel als zwei spezifische Aufgaben behandelt, was es einem tiefen Modell erschwert, seine Schließfähigkeiten bei mehreren Mathematikaufgaben zu vereinheitlichen. Im Wesentlichen haben diese beiden Aufgaben jedoch ähnliche Problemrepräsentationen und überlappendes mathematisches Wissen, das das Verständnis und die Schließfähigkeit eines tiefen Modells bei beiden Aufgaben verbessern kann.Daher erstellen wir eine groß angelegte vereinte Benchmark für geometrische Probleme, UniGeo, die 4.998 Berechnungsprobleme und 9.543 Beweisprobleme enthält. Jedes Beweisproblem ist mit einem mehrschrittigen Beweis versehen, der Begründungen und mathematische Ausdrücke umfasst. Der Beweis kann leicht in eine Beweissequenz umformuliert werden, die die gleichen Formate wie die annotierte Programmsequenz für Berechnungsprobleme teilt. Natürlich präsentieren wir auch einen vereinten mehrfach-aufgabenbasierten Geometrischen Transformer-Framework, den Geoformer, der dazu dient, Berechnungs- und Beweisaufgaben gleichzeitig im Format der Sequenzgenerierung zu lösen. Dies zeigt letztendlich, dass die Schließfähigkeit bei beiden Aufgaben durch eine vereinte Formulierung verbessert werden kann.Darüber hinaus schlagen wir eine Methode des vorgeschalteten Trainings mathematischer Ausdrücke (Mathematical Expression Pretraining, MEP) vor, deren Ziel es ist, die mathematischen Ausdrücke in der Lösung des Problems vorherzusagen und damit das Geoformer-Modell zu verbessern. Experimente mit UniGeo zeigen, dass unser vorgeschlagener Geoformer durch Überlegenheit gegenüber dem aufgabenspezifischen Modell NGS sowohl bei Berechnungs- als auch bei Beweisaufgaben Spitzenleistungen erzielt: Er erreicht eine Genauigkeit von über 5,6 % und 3,2 % höher als NGS bei diesen beiden Aufgabentypen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
UniGeo: Vereinheitlichung geometrischer logischen Schlussfolgerungen durch Umformulierung mathematischer Ausdrücke | Paper | HyperAI