Zero-Resource Cross-Domain Named Entity Recognition Überressourcenfreie Kreuzdomänen-Namenerkennung

Bestehende Modelle für die cross-domain Named Entity Recognition (NER) basieren auf zahlreichen unannotierten Korpora oder annotierten NER-Trainingsdaten in den Zielbereichen. Die Datensammlung für ressourcenarme Zielbereiche ist jedoch nicht nur kostspielig, sondern auch zeitaufwendig. Daher schlagen wir ein cross-domain NER-Modell vor, das keine externen Ressourcen verwendet. Zunächst führen wir ein Multi-Task-Lernen (MTL) ein, indem wir eine neue Zielfunktion hinzufügen, um zu erkennen, ob Token benannte Entitäten sind oder nicht. Anschließend stellen wir einen Rahmenwerk namens Mixture of Entity Experts (MoEE) vor, um die Robustheit bei der Adaptierung in Bereiche ohne Ressourcen zu verbessern. Schließlich zeigen experimentelle Ergebnisse, dass unser Modell starke unüberwachte cross-domain Sequenzlabeling-Modelle übertrifft und die Leistung unseres Modells derjenigen des momentan besten Modells nahekommt, das umfangreiche Ressourcen nutzt.