HyperAIHyperAI
vor 2 Monaten

Named Entity Recognition mit bidirektionalen LSTM-CNNs

Jason P.C. Chiu; Eric Nichols
Named Entity Recognition mit bidirektionalen LSTM-CNNs
Abstract

Die Named-Entity-Erkennung ist eine anspruchsvolle Aufgabe, die traditionell große Mengen an Wissen in Form von Merkmalsingenieurwesen und Lexika erfordert, um hohe Leistung zu erzielen. In dieser Arbeit stellen wir eine neuartige neuronale Netzwerkarchitektur vor, die automatisch Wort- und Zeichenebenen-Merkmale mit einer hybriden bidirektionalen LSTM- und CNN-Architektur erkennt, wodurch das meiste Merkmalsingenieurwesen entbehrlich wird. Wir schlagen außerdem eine neuartige Methode zur Kodierung partieller Lexikabereinstimmungen in neuronalen Netzen vor und vergleichen sie mit bestehenden Ansätzen. Eine umfangreiche Auswertung zeigt, dass unser System bei nur tokenisierter Textebene und öffentlich verfügbaren Wort-Vektoren im CoNLL-2003-Datensatz wettbewerbsfähig ist und die bisher berichteten Stand der Technik-Leistungen im OntoNotes 5.0-Datensatz um 2,13 F1-Punkte übertrifft. Durch die Verwendung von zwei aus öffentlichen Quellen stammenden Lexika legen wir neue Stand der Technik-Leistungen fest: ein F1-Wert von 91,62 für CoNLL-2003 und 86,28 für OntoNotes, wobei wir Systeme übertreffen, die auf intensivem Merkmalsingenieurwesen, proprietären Lexika und reichhaltigen Entitätsverknüpfungsdaten basieren.