Reconnaissance d'Entités Nommées avec des LSTM-CNNs Bidirectionnels

La reconnaissance d'entités nommées est une tâche complexe qui a traditionnellement nécessité de grandes quantités de connaissances sous forme d'ingénierie des caractéristiques et de lexiques pour atteindre des performances élevées. Dans cet article, nous présentons une nouvelle architecture de réseau neuronal capable de détecter automatiquement les caractéristiques au niveau des mots et des caractères grâce à une structure hybride bidirectionnelle LSTM et CNN, éliminant ainsi la nécessité de l'ingénierie des caractéristiques dans la plupart des cas. Nous proposons également une méthode innovante pour encoder les correspondances partielles de lexique dans les réseaux neuronaux et la comparons aux approches existantes. Une évaluation approfondie montre que, avec uniquement du texte tokenisé et des plongements (embeddings) de mots disponibles publiquement, notre système est compétitif sur le jeu de données CoNLL-2003 et dépasse les performances précédemment rapportées comme étant l'état de l'art sur le jeu de données OntoNotes 5.0 avec un gain de 2,13 points en F1. En utilisant deux lexiques construits à partir de sources publiques, nous établissons un nouveau niveau d'état de l'art avec un score F1 de 91,62 sur CoNLL-2003 et 86,28 sur OntoNotes, surpassant ainsi les systèmes qui font usage d'une ingénierie intensive des caractéristiques, de lexiques propriétaires et d'informations riches sur le lien entre entités.