HyperAIHyperAI
vor 11 Tagen

JBNU-CCLab am SemEval-2022-Aufgabe 12: Machine Reading Comprehension und Span-Paar-Klassifikation zur Verknüpfung mathematischer Symbole mit ihren Beschreibungen

{Seung-Hoon Na, Sung-Min Lee}
JBNU-CCLab am SemEval-2022-Aufgabe 12: Machine Reading Comprehension und Span-Paar-Klassifikation zur Verknüpfung mathematischer Symbole mit ihren Beschreibungen
Abstract

Diese Arbeit beschreibt unser System für die SemEval-2022-Aufgabe 12: „Verknüpfung mathematischer Symbole mit ihren Beschreibungen“, bei der wir in der Leaderboard-Rangliste für alle Teilaufgaben, die aus der Named-Entity-Extraktion (NER) und der Relationsextraktion (RE) bestehen, den ersten Platz erreichten. Unser System basiert auf einem zweistufigen Pipeline-Modell, das auf SciBERT aufbaut und Symbole, deren Beschreibungen sowie deren Beziehungen in wissenschaftlichen Dokumenten erkennt. Das System setzt sich aus zwei Komponenten zusammen: 1) einem maschinellen Leseverständnis-basierten NER-Modell, bei dem jede Entitätstypen als Frage formuliert wird und die entsprechenden Entitäts-Textabschnitte als Antwort mittels eines MRC-Modells extrahiert werden, und 2) einer Span-Paar-Klassifikation für die RE, bei der zwei Entitätsabschnitte sowie deren Typ-Marker in Span-Repräsentationen kodiert werden, die anschließend einem Softmax-Klassifikator zugeführt werden. Zudem setzen wir einen regelbasierten Symbol-Tokenizer ein, um die genaue Erkennung der Grenzen von Symbol-Entitäten zu verbessern. Zusätzlich werden Regularisierungs- und Ensembling-Methoden untersucht, um die Leistung des RE-Modells weiter zu steigern.

JBNU-CCLab am SemEval-2022-Aufgabe 12: Machine Reading Comprehension und Span-Paar-Klassifikation zur Verknüpfung mathematischer Symbole mit ihren Beschreibungen | Neueste Forschungsarbeiten | HyperAI