SAIS : Supervision et augmentation des étapes intermédiaires pour l'extraction de relations au niveau du document

En passant du niveau de phrase au niveau de document, la recherche sur l'extraction de relations (RE) fait face à une longueur croissante des textes et à des interactions entre entités plus complexes. En conséquence, il devient plus difficile d’encoder les sources d’information clés — à savoir les contextes pertinents et les types d’entités. Toutefois, les méthodes existantes ne modélisent ces sources d’information essentielles qu’implicitement durant l’apprentissage de la RE. Ce manque de supervision explicite conduit à des problèmes tels qu’une supervision inefficace et des prédictions du modèle peu interprétables. À l’inverse, nous proposons d’enseigner explicitement au modèle à capturer les contextes pertinents et les types d’entités en supervisant et en enrichissant les étapes intermédiaires (SAIS, Supervising and Augmenting Intermediate Steps) pour la RE. Sur la base d’un large éventail de tâches soigneusement conçues, notre méthode SAIS permet non seulement d’extraire des relations de meilleure qualité grâce à une supervision plus efficace, mais aussi de retrouver avec plus de précision les preuves correspondantes, améliorant ainsi l’interprétabilité. En évaluant l’incertitude du modèle, SAIS renforce encore les performances par une augmentation de données fondée sur les preuves et une inférence par ensemble, tout en réduisant le coût computationnel. En fin de compte, SAIS atteint des résultats de pointe en RE sur trois benchmarks (DocRED, CDR et GDA), surpassant le deuxième meilleur modèle de 5,04 % en score F1 pour la récupération de preuves sur DocRED.