Extraction conjointe d'entités et de relations à partir de documents scientifiques : rôle des informations linguistiques et des types d'entités

Les articles scientifiques contiennent divers types d'entités spécifiques au domaine ainsi que des relations entre celles-ci. Ces entités et leurs relations captent de manière concise des informations essentielles sur le sujet du document, et sont donc cruciales pour la compréhension et l'analyse automatique des documents. Dans cet article, nous visons à extraire automatiquement entités et relations à partir d'un résumé scientifique en utilisant un modèle neuronal profond. Étant donné une phrase d'entrée, nous utilisons un transformateur pré-entraîné pour produire des embeddings contextuels des tokens, qui sont ensuite enrichis par les embeddings de leurs étiquettes de partie du discours (POS). Une séquence de représentations de tokens enrichis forme un segment (span), et les entités ainsi que les relations sont apprises conjointement à partir de ces segments. Les logits d'entités prédits par le classificateur d'entités sont utilisés comme caractéristiques dans le classificateur de relations. Le modèle proposé améliore les méthodes de référence existantes dans la littérature pour l'extraction d'entités et de relations sur les jeux de données SciERC et ADE.