JBNU-CCLab am SemEval-2022-Aufgabe 12: Machine Reading Comprehension und Span-Paar-Klassifikation zur Verknüpfung mathematischer Symbole mit ihren Beschreibungen
{Seung-Hoon Na Sung-Min Lee}

Abstract
Diese Arbeit beschreibt unser System für die SemEval-2022-Aufgabe 12: „Verknüpfung mathematischer Symbole mit ihren Beschreibungen“, bei der wir in der Leaderboard-Rangliste für alle Teilaufgaben, die aus der Named-Entity-Extraktion (NER) und der Relationsextraktion (RE) bestehen, den ersten Platz erreichten. Unser System basiert auf einem zweistufigen Pipeline-Modell, das auf SciBERT aufbaut und Symbole, deren Beschreibungen sowie deren Beziehungen in wissenschaftlichen Dokumenten erkennt. Das System setzt sich aus zwei Komponenten zusammen: 1) einem maschinellen Leseverständnis-basierten NER-Modell, bei dem jede Entitätstypen als Frage formuliert wird und die entsprechenden Entitäts-Textabschnitte als Antwort mittels eines MRC-Modells extrahiert werden, und 2) einer Span-Paar-Klassifikation für die RE, bei der zwei Entitätsabschnitte sowie deren Typ-Marker in Span-Repräsentationen kodiert werden, die anschließend einem Softmax-Klassifikator zugeführt werden. Zudem setzen wir einen regelbasierten Symbol-Tokenizer ein, um die genaue Erkennung der Grenzen von Symbol-Entitäten zu verbessern. Zusätzlich werden Regularisierungs- und Ensembling-Methoden untersucht, um die Leistung des RE-Modells weiter zu steigern.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| joint-entity-and-relation-extraction-on-6 | MRC-based NER + Span pair classification with solid marker + ensemble | Entity F1 (partial): 47.61 Relation F1: 37.19 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.