Extraction efficace des relations à longue portée avec DG-SpanBERT

Dans le domaine du traitement du langage naturel, l'extraction de relations vise à comprendre rationnellement les textes non structurés. Dans cet article, nous proposons un nouveau modèle basé sur SpanBERT et combinant un réseau de convolution de graphe (DG-SpanBERT), capable d'extraire des caractéristiques sémantiques à partir d'une phrase brute grâce à un modèle linguistique pré-entraîné (SpanBERT) et à un réseau de convolution de graphe permettant de regrouper les caractéristiques latentes. Notre modèle DG-SpanBERT bénéficie de l'avantage de SpanBERT dans l'apprentissage de caractéristiques lexicales riches à partir de grands corpus. Il permet également de capturer efficacement les relations à longue portée entre entités grâce à l'usage du réseau de convolution de graphe sur l'arbre de dépendance. Les résultats expérimentaux montrent que notre modèle surpasser d'autres modèles existants basés sur les dépendances ou sur les séquences, et atteint une performance de pointe sur le jeu de données TACRED.