Vereinfachung der Lexikonverwendung in der chinesischen NER

Kürzlich haben viele Arbeiten versucht, die Leistung der chinesischen Namenerkennung (NER) durch das Einbeziehen von Wörterbüchern zu verbessern. Als repräsentatives Beispiel hat Lattice-LSTM (Zhang und Yang, 2018) neue Referenzwerte auf mehreren öffentlichen chinesischen NER-Datensätzen erzielt. Allerdings verfügt Lattice-LSTM über eine komplexe Modellarchitektur, was seine Anwendung in vielen industriellen Bereichen, in denen Echtzeit-NER-Antworten benötigt werden, einschränkt.In dieser Arbeit schlagen wir eine einfache, aber effektive Methode vor, um das Wörterbuch in die Zeichendarstellungen zu integrieren. Diese Methode vermeidet es, eine komplizierte Sequenzmodellierung zu entwerfen, und für jedes neuronale NER-Modell ist nur eine feine Anpassung der Zeichendarstellungsschicht erforderlich, um die Lexikoninformationen einzuführen. Experimentelle Studien auf vier Benchmark-Chinesische-NER-Datensätzen zeigen, dass unsere Methode bis zu 6,15 Mal schneller inferiert als die besten bisher bekannten Methoden und gleichzeitig bessere Ergebnisse liefert. Die experimentellen Ergebnisse belegen zudem, dass die vorgeschlagene Methode leicht mit vorab trainierten Modellen wie BERT kombiniert werden kann.