RH-Net : Amélioration de l'extraction relationnelle neuronale grâce à l'apprentissage par renforcement et à la recherche hiérarchique des relations

La supervision distante (DS) vise à générer un corpus d’étiquetage heuristique à grande échelle, largement utilisé actuellement pour l’extraction relationnelle neuronale. Toutefois, elle souffre fortement du problème des étiquetages bruités et de la distribution à queue longue. De nombreuses approches avancées traitent ces deux problèmes séparément, négligeant ainsi leurs interactions mutuelles. Dans cet article, nous proposons un cadre novateur appelé RH-Net, qui exploite l’apprentissage par renforcement et un module hiérarchique de recherche relationnelle afin d’améliorer l’extraction relationnelle. Nous utilisons l’apprentissage par renforcement pour guider le modèle dans la sélection d’instances de haute qualité. Par la suite, nous introduisons un module de recherche relationnelle hiérarchique permettant de partager les significations entre instances corrélées, notamment entre les classes riches en données et celles pauvres en données. Au cours d’un processus itératif, ces deux modules interagissent continuellement afin de atténuer simultanément les problèmes du bruit et de la distribution à queue longue. Des expériences étendues sur le jeu de données NYT largement utilisé montrent clairement que notre méthode obtient des améliorations significatives par rapport aux meilleures méthodes existantes.