HyperAIHyperAI
il y a 17 jours

Conception du Modèle en Aval pour une Tâche d'Extraction de Relations basée sur un Modèle Linguistique Pré-entraîné

Cheng Li, Ye Tian
Conception du Modèle en Aval pour une Tâche d'Extraction de Relations basée sur un Modèle Linguistique Pré-entraîné
Résumé

Les méthodes supervisées d'extraction de relations basées sur les réseaux neuronaux profonds jouent un rôle crucial dans le domaine récent de l'extraction d'information. Toutefois, leur performance reste encore insuffisante pour atteindre un niveau satisfaisant en raison de la complexité des relations à extraire. D'un autre côté, les modèles linguistiques pré-entraînés (PLMs), récemment proposés, ont connu un succès remarquable dans diverses tâches de traitement du langage naturel grâce au fine-tuning lorsqu'ils sont combinés avec des modèles de tâches spécifiques. Toutefois, la tâche d'extraction de relations n'est pas encore incluse parmi les tâches standards d'origine des PLMs. Nous pensons que les PLMs peuvent également être utilisés pour résoudre le problème d'extraction de relations, mais il est nécessaire de concevoir un modèle de tâche descendante spécifique, voire une fonction de perte adaptée, afin de traiter efficacement les relations complexes. Dans cet article, une nouvelle architecture de réseau, associée à une fonction de perte particulière, est proposée comme modèle de tâche descendante pour les PLMs dans le cadre de l'extraction de relations supervisée. Les expérimentations ont démontré que notre méthode dépasse significativement les modèles de référence les plus performants actuellement disponibles sur plusieurs jeux de données publics d'extraction de relations.