Extraction de relations à queue longue supervisée à distance à l'aide de graphes contraints

Le bruit des étiquettes et les distributions à queue longue constituent deux défis majeurs dans l'extraction de relations supervisée de manière distante. Les études récentes ont montré des progrès considérables en matière de débruitage, mais ont accordé peu d'attention au problème des relations à queue longue. Dans cet article, nous introduisons un graphe de contraintes pour modéliser les dépendances entre les étiquettes de relation. Sur cette base, nous proposons un nouveau cadre d'extraction de relations basé sur le graphe de contraintes (CGRE) capable de relever simultanément ces deux défis. Le CGRE utilise des réseaux de convolution graphique pour propager l'information des nœuds de relation riches en données vers les nœuds de relation pauvres en données, ce qui améliore ainsi l'apprentissage des représentations des relations à queue longue. Pour renforcer encore la résistance au bruit, un module d'attention sensible aux contraintes est conçu dans le CGRE afin d'intégrer les informations de contrainte. Des résultats expérimentaux approfondis montrent que le CGRE réalise des améliorations significatives par rapport aux méthodes précédentes tant en termes de débruitage que d'extraction de relations à queue longue. Les jeux de données pré-traités et le code source sont disponibles publiquement sur https://github.com/tmliang/CGRE.