Command Palette
Search for a command to run...
Chinesische NER mit Lattice LSTM
Chinesische NER mit Lattice LSTM
Yue Zhang; Jie Yang
Zusammenfassung
Wir untersuchen ein gitterstrukturiertes LSTM-Modell für die chinesische Named Entity Recognition (NER), das eine Sequenz von Eingabezeichen sowie alle potenziellen Wörter, die einem Lexikon entsprechen, kodiert. Im Vergleich zu zeichenbasierten Methoden nutzt unser Modell explizit Worts- und Wortsequenzinformationen. Im Vergleich zu wortbasierten Methoden ist das gitterstrukturierte LSTM nicht anfällig für Segmentierungsfehler. Gated Recurrent Cells ermöglichen es unserem Modell, die relevantesten Zeichen und Wörter aus einem Satz zur Verbesserung der NER-Ergebnisse auszuwählen. Experimente mit verschiedenen Datensätzen zeigen, dass das gitterstrukturierte LSTM sowohl wortbasierte als auch zeichenbasierte LSTM-Baselines übertrifft und die besten Ergebnisse erzielt.