HyperAIHyperAI

Command Palette

Search for a command to run...

Verbesserung des neuronalen RST-Parsing-Modells durch Silber-Übereinstimmungs-Subbäume

Masaaki Nagata Manabu Okumura Hidetaka Kamigaito Tsutomu Hirao Naoki Kobayashi

Zusammenfassung

Die meisten bisherigen Ansätze zur Rhetorical Structure Theory (RST)-Parsing basieren auf überwachtem Lernen, beispielsweise neuronalen Netzwerken, die eine ausreichend große und qualitativ hochwertige annotierte Korpusdatenmenge erfordern. Der RST Discourse Treebank (RST-DT), der Standardbenchmark für den RST-Parsing im Englischen, ist jedoch aufgrund der kostenintensiven Annotation von RST-Bäumen klein. Der Mangel an großskaligen annotierten Trainingsdaten führt zu einer schlechten Leistung, insbesondere bei der Relationenklassifizierung. Daher schlagen wir eine Methode vor, die neuronale RST-Parsing-Modelle durch Ausnutzung von Silberdaten – also automatisch annotierten Daten – verbessert. Wir generieren eine großskalige Silberdatenmenge aus einem ungelabelten Korpus mittels eines modernen RST-Parsers. Um qualitativ hochwertige Silberdaten zu erhalten, extrahieren wir Übereinstimmungsunterbäume aus den RST-Bäumen, die für Dokumente mittels RST-Parsern erstellt wurden. Anschließend prätrainieren wir einen neuronalen RST-Parser mit den gewonnenen Silberdaten und feinjustieren ihn anschließend am RST-DT. Experimentelle Ergebnisse zeigen, dass unsere Methode die besten Mikro-F1-Scores für Nuclearität und Relation mit 75,0 beziehungsweise 63,2 erreichte. Zudem erzielten wir eine bemerkenswerte Steigerung des Relation-Scores um 3,0 Punkte im Vergleich zum bisherigen Stand der Technik.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Verbesserung des neuronalen RST-Parsing-Modells durch Silber-Übereinstimmungs-Subbäume | Paper | HyperAI