HyperAIHyperAI
vor 2 Monaten

Sequence-to-Nuggets: Erkennung verschachtelter Entitätsmentionen durch Anchor-Region Netze

Hongyu Lin; Yaojie Lu; Xianpei Han; Le Sun
Sequence-to-Nuggets: Erkennung verschachtelter Entitätsmentionen durch Anchor-Region Netze
Abstract

Sequentielle Labeling-basierte NER-Ansätze beschränken jedes Wort darauf, zu höchstens einer Entitätserwähnung zu gehören, was bei der Erkennung verschachtelter Entitätserwähnungen ein ernsthaftes Problem darstellen wird. In dieser Arbeit schlagen wir vor, dieses Problem durch Modellierung und Nutzung der head-getriebenen Phrasenstrukturen von Entitätserwähnungen zu lösen, d.h., obwohl eine Erwähnung andere Erwähnungen verschachteln kann, teilen sie sich nicht dasselbe Hauptwort. Genauer gesagt schlagen wir Anchor-Region Networks (ARNs) vor, eine sequenz-zu-Nuggets-Architektur für die Erkennung verschachtelter Erwähnungen. ARNs identifizieren zunächst die Ankerwörter (d.h., mögliche Hauptwörter) aller Erwähnungen und erkennen dann die Grenzen jeder Erwerbung durch Ausnutzung regulärer Phrasenstrukturen. Darüber hinaus haben wir auch Bag Loss entwickelt, eine Zielfunktion, die es ermöglicht, ARNs ohne Verwendung irgendwelcher Ankerwortannotierungen in einem end-to-end-Prozess zu trainieren. Experimente zeigen, dass ARNs den Stand der Technik auf drei Standardbenchmarks für die Erkennung verschachtelter Entitätserwähnungen erreichen.请注意,"Nuggets" 是一个不太常见的术语,因此在翻译中保留了英文原词,并在首次出现时加了括号注释。此外,“end-to-end” 在德语中通常也保留为英文,以保持专业性。

Sequence-to-Nuggets: Erkennung verschachtelter Entitätsmentionen durch Anchor-Region Netze | Neueste Forschungsarbeiten | HyperAI