HyperAIHyperAI
il y a 17 jours

Un nouveau cadre hiérarchique à étiquetage binaire pour l'extraction de triples relationnels

Zhepei Wei, Jianlin Su, Yue Wang, Yuan Tian, Yi Chang
Un nouveau cadre hiérarchique à étiquetage binaire pour l'extraction de triples relationnels
Résumé

L'extraction de triples relationnels à partir de textes non structurés est essentielle pour la construction à grande échelle de graphes de connaissances. Toutefois, peu de travaux existants se distinguent dans la résolution du problème des triples imbriqués, où plusieurs triples relationnels dans une même phrase partagent les mêmes entités. Dans ce travail, nous proposons une nouvelle perspective pour repenser la tâche d'extraction de triples relationnels, en introduisant un cadre novateur de balisage binaire en cascade (CasRel), fondé sur une formulation rigoureuse du problème. Contrairement aux approches antérieures qui traitaient les relations comme des étiquettes discrètes, notre cadre modélise les relations comme des fonctions qui associent des sujets à des objets au sein d'une phrase, une approche qui gère naturellement le problème des triples imbriqués. Les expériences montrent que le cadre CasRel surpasser déjà les méthodes de pointe, même lorsque son module encodeur utilise un encodeur BERT initialisé aléatoirement, ce qui démontre la puissance de la nouvelle architecture de balisage. Une amélioration supplémentaire des performances est observée lors de l’utilisation d’un encodeur BERT pré-entraîné, avec des gains absolus de 17,5 et 30,2 en score F1 sur deux jeux de données publics, NYT et WebNLG, respectivement, surpassant ainsi la meilleure méthode de référence. Une analyse approfondie menée sur différentes scénarios de triples imbriqués révèle que la méthode offre des gains de performance constants dans tous ces cas. Le code source et les données sont disponibles en ligne.

Un nouveau cadre hiérarchique à étiquetage binaire pour l'extraction de triples relationnels | Articles de recherche récents | HyperAI