HyperAIHyperAI
vor 2 Monaten

Chinesische NER mit Lattice LSTM

Yue Zhang; Jie Yang
Chinesische NER mit Lattice LSTM
Abstract

Wir untersuchen ein gitterstrukturiertes LSTM-Modell für die chinesische Named Entity Recognition (NER), das eine Sequenz von Eingabezeichen sowie alle potenziellen Wörter, die einem Lexikon entsprechen, kodiert. Im Vergleich zu zeichenbasierten Methoden nutzt unser Modell explizit Worts- und Wortsequenzinformationen. Im Vergleich zu wortbasierten Methoden ist das gitterstrukturierte LSTM nicht anfällig für Segmentierungsfehler. Gated Recurrent Cells ermöglichen es unserem Modell, die relevantesten Zeichen und Wörter aus einem Satz zur Verbesserung der NER-Ergebnisse auszuwählen. Experimente mit verschiedenen Datensätzen zeigen, dass das gitterstrukturierte LSTM sowohl wortbasierte als auch zeichenbasierte LSTM-Baselines übertrifft und die besten Ergebnisse erzielt.

Chinesische NER mit Lattice LSTM | Neueste Forschungsarbeiten | HyperAI