Zero-Resource Cross-Lingual Named Entity Recognition Überressourcenfreie Kreuzsprachliche Namensentitätserkennung

Kürzlich haben neuronale Methoden in der Namensentitätserkennung (NER) für viele Sprachen ohne die Notwendigkeit manuell erstellter Merkmale den aktuellen Stand der Technik (SOTA) erreicht. Allerdings benötigen diese Modelle weiterhin manuell annotierte Trainingsdaten, die für viele Sprachen nicht verfügbar sind. In dieser Arbeit schlagen wir ein unüberwachtes, cross-linguale NER-Modell vor, das Wissensübertragung von einer Sprache auf eine andere vollständig unüberwacht durchführt, ohne auf ein zweisprachiges Wörterbuch oder parallele Daten zurückzugreifen. Unser Modell erreicht dies durch wortbasiertes adversariales Lernen und erweitertes Feinjustieren mit Parameter-Teilen und Merkmalsverstärkung. Experimente mit fünf verschiedenen Sprachen zeigen die Effektivität unseres Ansatzes, indem sie bestehende Modelle deutlich übertreffen und einen neuen SOTA für jedes Sprachpaar festlegen.