Amélioration de la classification des relations par graphe de paires d'entités

La classification des relations est l'une des tâches les plus importantes dans le domaine de l'extraction d'informations, ainsi qu'un composant clé des systèmes nécessitant une compréhension relationnelle de textes non structurés. Les approches actuelles de classification des relations s'appuient principalement sur l'exploitation de ressources externes et de connaissances de fond afin d'améliorer les performances, tout en négligeant les corrélations entre les paires d'entités, qui pourtant s'avèrent utiles pour la classification relationnelle. Nous introduisons le concept de graphe de paires d'entités pour représenter ces corrélations, et proposons un nouveau modèle neuronal basé sur ce graphe, appelé EPGNN (Entity Pair Graph Neural Network), qui s'appuie sur un réseau de convolution de graphe (GCN) pour capturer les caractéristiques topologiques du graphe de paires d'entités. L'EPGNN combine les caractéristiques sémantiques des phrases issues d'un modèle pré-entraîné BERT avec les caractéristiques topologiques du graphe pour effectuer la classification des relations. Notre modèle exploite pleinement le corpus donné sans nécessiter de ressources externes ni de connaissances de fond. Les résultats expérimentaux sur deux jeux de données largement utilisés — SemEval 2010 Task 8 et ACE 2005 — montrent que notre méthode surpasser les approches de pointe actuelles.