HyperAIHyperAI

Command Palette

Search for a command to run...

Thor: Hämmer schwingen, um Sprachmodelle und automatisierte Beweisverfahren zu integrieren

Albert Q. Jiang Wenda Li Szymon Tworkowski Konrad Czechowski Tomasz Odrzygóźdź Piotr Miłoś Yuhuai Wu Mateja Jamnik

Zusammenfassung

Bei der Beweisführung stellt die Auswahl nützlicher Prämissen aus einer großen Bibliothek zur Lösung einer gegebenen Vermutung eine entscheidend wichtige Aufgabe dar. Dies stellt eine Herausforderung für alle Beweisverfahren dar, insbesondere für solche, die auf Sprachmodellen basieren, da diese aufgrund ihrer begrenzten Fähigkeit, große Mengen an prämissenhaltigen Texten zu verarbeiten und zu schließen, Schwierigkeiten haben. In dieser Arbeit stellen wir Thor vor, einen Rahmen, der Sprachmodelle und automatisierte Beweissysteme integriert, um diese Schwierigkeit zu überwinden. In Thor werden Methoden der Klasse der sogenannten „Hammers“ eingesetzt, die die Stärken automatisierter Beweissysteme nutzen, um Prämissen auszuwählen, während alle übrigen Aufgaben den Sprachmodellen übertragen werden. Thor steigert die Erfolgsrate eines Sprachmodells auf dem PISA-Datensatz von 39 % auf 57 % und löst zudem 8,2 % der Probleme, die weder Sprachmodelle noch automatisierte Beweissysteme allein bewältigen können. Zudem erreicht Thor mit einem deutlich geringeren Rechenaufwand eine Erfolgsquote auf dem MiniF2F-Datensatz, die mit den besten bestehenden Methoden vergleichbar ist. Thor kann über einen einfachen, von uns bereitgestellten Protokollmechanismus für die Mehrheit der gängigen interaktiven Beweissysteme implementiert werden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Thor: Hämmer schwingen, um Sprachmodelle und automatisierte Beweisverfahren zu integrieren | Paper | HyperAI