HyperAIHyperAI
il y a 2 mois

AIFB-WebScience à SemEval-2022 Tâche 12 : Extraction de Relations en Première -- Utilisation de l'Extraction de Relations pour Identifier les Entités

Nicholas Popovic; Walter Laurito; Michael Färber
AIFB-WebScience à SemEval-2022 Tâche 12 : Extraction de Relations en Première -- Utilisation de l'Extraction de Relations pour Identifier les Entités
Résumé

Dans cet article, nous présentons une approche de extraction conjointe d'entités et de relations basée sur des modèles de langage à base de transformers. Nous appliquons ce modèle à la tâche de lier les symboles mathématiques à leurs descriptions dans des documents LaTeX. Contrairement aux approches existantes, qui effectuent l'extraction d'entités et de relations de manière séquentielle, notre système intègre les informations issues de l'extraction de relations dans l'extraction d'entités. Cela signifie que le système peut être formé même sur des ensembles de données où seule une partie des entités valides est annotée. Nous fournissons une évaluation exhaustive du système proposé, mettant en lumière ses forces et ses faiblesses. Notre approche, qui peut être ajustée dynamiquement en termes de complexité computationnelle lors de l'inférence, produit des prédictions avec une précision élevée et occupe la 3ème place du classement de la tâche 12 de SemEval-2022. Pour les entrées dans le domaine de la physique et des mathématiques, elle atteint des scores macro F1 élevés pour l'extraction de relations, respectivement 95,43 % et 79,17 %. Le code utilisé pour former et évaluer nos modèles est disponible à l'adresse suivante : https://github.com/nicpopovic/RE1st