HyperAIHyperAI

Command Palette

Search for a command to run...

APOLLO: Ein optimierter Trainingsansatz für langformige numerische Schlussfolgerungen

Jiashuo Sun Hang Zhang Chen Lin Xiangdong Su Yeyun Gong Jian Guo

Zusammenfassung

Langform-Zahlenschlussfolgerung in der Finanzanalyse zielt darauf ab, einen Schlussfolgerungsprogramm zu generieren, um die korrekte Antwort auf eine gegebene Frage zu berechnen. Frühere Ansätze folgten einem Retriever-Generator-Framework, bei dem der Retriever relevante Fakten aus einem langen Dokument auswählt und der Generator basierend auf den abgerufenen Fakten ein Schlussfolgerungsprogramm generiert. Allerdings wurden dabei alle Fakten gleich behandelt, ohne die unterschiedlichen Beiträge von Fakten mit und ohne Zahlen zu berücksichtigen. Gleichzeitig wurden Programm-Konsistenzkriterien im Rahmen überwachter Trainingsprozesse vernachlässigt, was zu einer geringeren Trainingsgenauigkeit und geringeren Vielfalt führte. Um diese Probleme zu lösen, schlagen wir APOLLO vor, um das Framework für langform-Zahlenschlussfolgerung zu verbessern. Für den Retriever verwenden wir eine zahlenbewusste negative Sampling-Strategie, um den Retriever sensitiver gegenüber zentralen numerischen Fakten zu machen. Für den Generator entwickeln wir eine konsistenzbasierte Verstärkungslernmethode sowie eine Zielprogramm-Erweiterungsstrategie, die auf der Konsistenz der Ausführungsergebnisse des Programms basiert. Experimentelle Ergebnisse auf den Leaderboards von FinQA und ConvFinQA bestätigen die Wirksamkeit unseres Ansatzes und erreichen eine neue state-of-the-art-Leistung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
APOLLO: Ein optimierter Trainingsansatz für langformige numerische Schlussfolgerungen | Paper | HyperAI