Reconnaissance d'entités nommées et extraction de relations par remplissage de table amélioré basé sur des représentations contextualisées

Dans cette étude, une nouvelle méthode d'extraction d'entités nommées et de relations à partir de textes non structurés, fondée sur une représentation tabulaire, est présentée. Grâce à des embeddings contextuels de mots, la méthode proposée calcule des représentations pour les mentions d'entités et les dépendances à longue portée, sans recourir à des caractéristiques manuellement conçues complexes ni à des architectures de réseaux neuronaux sophistiquées. Nous adaptons également un produit scalaire tensoriel afin de prédire toutes les étiquettes de relations simultanément, sans avoir recours à des prédictions basées sur l'histoire ou à des stratégies de recherche. Ces avancées simplifient considérablement le modèle et l'algorithme d'extraction d'entités nommées et de relations. Malgré sa simplicité, les résultats expérimentaux montrent que la méthode proposée surpasser les méthodes de pointe sur les jeux de données CoNLL04 et ACE05 en anglais. Nous confirmons également que la méthode proposée atteint une performance comparable aux meilleurs modèles d'extraction d'entités nommées sur le jeu de données ACE05 lorsque plusieurs phrases sont fournies pour l'agrégation contextuelle.