Structure d'entité au sein et à travers le document : Modélisation des dépendances de mention pour l'extraction de relations à l'échelle du document

Les entités, en tant qu'éléments essentiels dans les tâches d'extraction de relations, présentent une certaine structure. Dans ce travail, nous modélisons cette structure sous la forme de dépendances distinctives entre paires de mentions. Nous proposons ensuite SSAN, qui intègre ces dépendances structurelles dans le mécanisme standard d'attention auto-attentionnel, tout au long de l'étape d'encodage globale. Plus précisément, nous concevons deux modules de transformation alternatifs à l'intérieur de chaque bloc fondamental d'attention auto-attentionnelle afin de générer des biais attentifs, permettant ainsi de régulariser de manière adaptative le flux d'attention. Nos expérimentations démontrent l'utilité de la structure d'entité proposée ainsi que l'efficacité de SSAN. Ce modèle surpasse significativement les méthodes de référence, atteignant de nouveaux résultats d'état de l'art sur trois jeux de données populaires d'extraction de relations à l'échelle du document. Nous fournissons également des études d'ablation et des visualisations pour illustrer la manière dont la structure d'entité guide le modèle vers une extraction de relations améliorée. Le code source est disponible publiquement.