Span-basiertes Modell für die Relationsextraktion

Relation Extraction ist die Aufgabe, in Rohtexten vorkommende Entitätenabschnitte zu identifizieren und anschließend die Beziehungen zwischen Paaren solcher Entitätsmentionen zu erkennen. Kürzlich vorgestellte Ansätze für diese span-basierte Aufgabe stützen sich auf token-basierte Modelle, die inhärente Einschränkungen aufweisen. Sie können span-basierte Merkmale nicht einfach definieren und implementieren, können überlappende Entitätsmentionen nicht modellieren und leiden unter kaskadenartigen Fehlern aufgrund der Verwendung sequenzieller Dekodierung. Um diese Probleme anzugehen, präsentieren wir ein Modell, das alle möglichen Abschnitte direkt modelliert und die Erkennung von Entitätsmentionen sowie die Relationsextraktion gemeinsam durchführt. Wir erreichen eine neue state-of-the-art-Leistung von 62,83 F1 (vorheriger Bestwert: 60,49) auf dem ACE2005-Datensatz.