DREEAM : Guider l'attention grâce à des preuves pour améliorer l'extraction de relations au niveau du document

L’extraction de relations au niveau du document (DocRE) consiste à identifier toutes les relations entre chaque paire d’entités présentes dans un document. Les preuves, définies comme les phrases contenant des indices relatifs à la relation entre une paire d’entités, ont été montrées comme utiles pour aider les systèmes de DocRE à se concentrer sur les passages pertinents, améliorant ainsi l’extraction des relations. Toutefois, la récupération de preuves (ER) dans le cadre de la DocRE soulève deux problèmes majeurs : une consommation élevée de mémoire et une disponibilité limitée des annotations. Ce travail vise à résoudre ces défis afin d’améliorer l’utilisation de l’ER dans la DocRE. Premièrement, nous proposons DREEAM, une approche efficace en mémoire qui utilise l’information sur les preuves comme signal de supervision, guidant ainsi les modules d’attention du système de DocRE à attribuer des poids élevés aux preuves. Deuxièmement, nous introduisons une stratégie d’auto-entraînement pour DREEAM, permettant d’apprendre l’ER à partir de preuves générées automatiquement à grande échelle, sans nécessiter d’annotations de preuves. Les résultats expérimentaux montrent que notre approche atteint des performances de pointe sur le benchmark DocRED, tant pour la DocRE que pour l’ER. À notre connaissance, DREEAM est la première méthode à exploiter l’auto-entraînement pour la récupération de preuves.