Command Palette
Search for a command to run...
Erzeugung von Gleichungen durch Nutzung von Operatoren: GEO-Modell
Erzeugung von Gleichungen durch Nutzung von Operatoren: GEO-Modell
Gahgene Gweon Bugeun Kim Donggeon Lee Kyung Seo Ki
Zusammenfassung
Die Lösung mathematischer Textaufgaben ist ein aufkommendes Forschungsthema im Bereich des Natural Language Processing. Kürzlich haben Forscher zur Bewältigung dieser Aufgabe architektonische Ansätze basierend auf Encoder-Decoder-Modellen eingesetzt, die ursprünglich für maschinelle Übersetzung entwickelt wurden. Die derzeit fortschrittlichsten neuronalen Modelle nutzen handkodierte Merkmale und basieren auf Generationsmethoden. In diesem Paper stellen wir das GEO-Modell (Generation of Equations by utilizing Operators) vor, das keine handkodierten Merkmale verwendet und zwei Probleme anspricht, die in bestehenden neuronalen Modellen auftreten: 1. den Mangel an domain-spezifischen Wissensmerkmalen und 2. den Verlust von Wissen auf Encoder-Ebene. Um das Problem fehlender domain-spezifischer Merkmale zu lösen, haben wir zwei Hilfsaufgaben entworfen: die Vorhersage von Unterschieden in Operationsgruppen und die Vorhersage impliziter Paare. Um das Problem des Verlusts von Wissen auf Encoder-Ebene zu beheben, haben wir eine Operation Feature Feed Forward (OP3F)-Schicht hinzugefügt. Experimentelle Ergebnisse zeigten, dass das GEO-Modell auf zwei Datensätzen die bestehenden state-of-the-art-Modelle übertraf: 85,1 % auf MAWPS und 62,5 % auf DRAW-1K, und eine vergleichbare Leistung von 82,1 % auf dem ALG514-Datensatz erreichte.