HyperAIHyperAI

Command Palette

Search for a command to run...

Erzeugung von Gleichungen durch Nutzung von Operatoren: GEO-Modell

Gahgene Gweon Bugeun Kim Donggeon Lee Kyung Seo Ki

Zusammenfassung

Die Lösung mathematischer Textaufgaben ist ein aufkommendes Forschungsthema im Bereich des Natural Language Processing. Kürzlich haben Forscher zur Bewältigung dieser Aufgabe architektonische Ansätze basierend auf Encoder-Decoder-Modellen eingesetzt, die ursprünglich für maschinelle Übersetzung entwickelt wurden. Die derzeit fortschrittlichsten neuronalen Modelle nutzen handkodierte Merkmale und basieren auf Generationsmethoden. In diesem Paper stellen wir das GEO-Modell (Generation of Equations by utilizing Operators) vor, das keine handkodierten Merkmale verwendet und zwei Probleme anspricht, die in bestehenden neuronalen Modellen auftreten: 1. den Mangel an domain-spezifischen Wissensmerkmalen und 2. den Verlust von Wissen auf Encoder-Ebene. Um das Problem fehlender domain-spezifischer Merkmale zu lösen, haben wir zwei Hilfsaufgaben entworfen: die Vorhersage von Unterschieden in Operationsgruppen und die Vorhersage impliziter Paare. Um das Problem des Verlusts von Wissen auf Encoder-Ebene zu beheben, haben wir eine Operation Feature Feed Forward (OP3F)-Schicht hinzugefügt. Experimentelle Ergebnisse zeigten, dass das GEO-Modell auf zwei Datensätzen die bestehenden state-of-the-art-Modelle übertraf: 85,1 % auf MAWPS und 62,5 % auf DRAW-1K, und eine vergleichbare Leistung von 82,1 % auf dem ALG514-Datensatz erreichte.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Erzeugung von Gleichungen durch Nutzung von Operatoren: GEO-Modell | Paper | HyperAI