Un Schéma d'Étiquetage Arboré Bidirectionnel pour l'Extraction de Relations Médicales Conjoints

L'extraction de relations médicales conjointes consiste à extraire des triplets, composés d'entités et de relations, à partir de textes médicaux en utilisant un seul modèle. L'une des solutions est de transformer cette tâche en une tâche de marquage séquentiel. Cependant, dans les travaux existants, les méthodes de représentation et de marquage des triplets de manière linéaire ont échoué face aux triplets chevauchants, tandis que les méthodes consistant à organiser les triplets sous forme de graphe se heurtent au défi d'un effort computationnel important. Dans cet article, inspirés par les structures relationnelles arborescentes présentes dans le texte médical, nous proposons un nouveau schéma appelé Marquage Arborescent Bidirectionnel (BiTT) pour former des triplets de relations médicales en deux arbres binaires et convertir ces arbres en une séquence de balises au niveau des mots. Sur la base du schéma BiTT, nous avons développé un modèle d'extraction de relations conjointes pour prédire les balises BiTT et extraire efficacement les triplets médicaux. Notre modèle surpasse les meilleures lignes de base avec une amélioration de 2,0 % et 2,5 % du score F1 sur deux jeux de données médicales. De plus, les modèles utilisant notre schéma BiTT obtiennent également des résultats prometteurs sur trois jeux de données publics d'autres domaines.