Paralleles Instanzabfrage-Netzwerk für die Erkennung benannter Entitäten

Die Erkennung benannter Entitäten (NER) ist eine grundlegende Aufgabe in der Natürlichen Sprachverarbeitung. Kürzliche Arbeiten behandeln die Erkennung benannter Entitäten als eine Leseverständnisaufgabe und konstruieren manuell typspezifische Abfragen, um Entitäten zu extrahieren. Dieses Paradigma leidet jedoch an drei Problemen. Erstens können typspezifische Abfragen bei jeder Inferenz nur eine Art von Entitäten extrahieren, was ineffizient ist. Zweitens ist die Extraktion verschiedener Arten von Entitäten isoliert, wobei die Abhängigkeiten zwischen ihnen ignoriert werden. Drittens basiert die Abfragekonstruktion auf externem Wissen und ist schwer an realistische Szenarien mit Hunderten von Entitätstypen anzupassen.Um diese Herausforderungen zu bewältigen, schlagen wir das Parallel Instance Query Network (PIQN) vor, welches globale und lernfähige Instanzabfragen einrichtet, um Entitäten aus einem Satz parallel zu extrahieren. Jede Instanzabfrage prognostiziert eine einzelne Entität, und durch gleichzeitiges Füttern aller Instanzabfragen können wir alle Entitäten parallel abfragen. Anstatt aus externem Wissen konstruiert zu werden, können Instanzabfragen während des Trainings ihre unterschiedlichen Abfragesemantiken erlernen.Für das Training des Modells behandeln wir die Labelzuweisung als ein One-to-Many Lineares Zuordnungsproblem (LAP) und weisen Goldentitäten den Instanzabfragen dynamisch mit minimalem Zuordnungskosten zu. Experimente sowohl auf verschachtelten als auch flachen NER-Datensätzen zeigen, dass unser vorgeschlagenes Verfahren die bisher besten Modelle übertrifft.