Extraction de relations au niveau du document avec estimation et focalisation de l'importance des phrases

L'extraction de relations au niveau du document (DocRE) vise à déterminer la relation entre deux entités à partir d'un document composé de plusieurs phrases. Les études récentes représentent généralement l'ensemble du document par des modèles basés sur des séquences ou des graphes pour prédire les relations de tous les paires d'entités. Cependant, nous avons constaté que ce type de modèle n'est pas robuste et présente des comportements étranges : il prédit correctement lorsque l'ensemble d'un document de test est fourni en entrée, mais commet des erreurs lorsque les phrases non pertinentes sont supprimées. A cet égard, nous proposons un cadre de estimation et focalisation de l'importance des phrases (SIEF) pour le DocRE, dans lequel nous concevons un score d'importance des phrases et une perte de focalisation des phrases, encourageant les modèles DocRE à se concentrer sur les phrases probantes. Les résultats expérimentaux dans deux domaines montrent que notre SIEF non seulement améliore les performances globales, mais rend également les modèles DocRE plus robustes. De plus, SIEF est un cadre général, dont l'efficacité a été démontrée lorsqu'il est combiné avec divers modèles de base DocRE.