Extraction de relation supervisée à distance avec reconstruction de phrase et priori de base de connaissances

Nous proposons une approche multi-tâches probabiliste visant à faciliter l'extraction de relations par supervision distante en rapprochant les représentations des phrases contenant les mêmes paires de base de connaissances. Pour cela, nous biaisons l'espace latent des phrases à l'aide d'un Autoencodeur Variationnel (VAE) entraîné conjointement avec un classificateur de relations. Le code latent guide les représentations des paires et influence la reconstruction des phrases. Les résultats expérimentaux sur deux jeux de données créés par supervision distante montrent que l'apprentissage multi-tâches conduit à des améliorations de performance. Une exploration supplémentaire de l'intégration de priori de base de connaissances dans le VAE révèle que l'espace des phrases peut être déplacé vers celui de la base de connaissances, offrant ainsi une meilleure interprétabilité et une amélioration supplémentaire des résultats.