HyperAIHyperAI
il y a 2 mois

Entailment textuel pour l’extraction d’arguments d’événements : approches à zéro et faible supervision avec apprentissage multi-source

Oscar Sainz; Itziar Gonzalez-Dios; Oier Lopez de Lacalle; Bonan Min; Eneko Agirre
Résumé

Des travaux récents ont montré que les tâches de traitement du langage naturel (NLP) telles que l'extraction de relations (RE) peuvent être reformulées en tant que tâches d'entailment textuel en utilisant des verbalisations, avec des performances élevées dans les configurations à zéro exemple et à quelques exemples grâce aux modèles d'entailment pré-entraînés. Le fait que les relations dans les jeux de données actuels de RE soient facilement verbalisables soulève des doutes quant à l'efficacité de l'entailment dans des tâches plus complexes. Dans cette étude, nous démontrons que l'entailment est également efficace pour l'extraction d'arguments d'événements (EAE), réduisant le besoin d'annotation manuelle à 50 % et 20 % respectivement pour ACE et WikiEvents, tout en atteignant les mêmes performances qu'un entraînement complet. Plus important encore, nous montrons que la reformulation de l'EAE en tant qu'entailment atténue la dépendance aux schémas, qui a été un obstacle majeur pour le transfert d'annotations entre domaines. Grâce à l'entailment, le transfert multi-sources entre ACE et WikiEvents réduit davantage l'annotation à 10 % et 5 % respectivement par rapport à un entraînement complet sans transfert. Notre analyse montre que la clé de bons résultats réside dans l'utilisation de plusieurs jeux de données d'entailment pour pré-entraîner le modèle d'entailment. De manière similaire aux approches précédentes, notre méthode nécessite un faible investissement pour la verbalisation manuelle : moins de 15 minutes par type d'argument d'événement sont requises, et des résultats comparables peuvent être obtenus par des utilisateurs ayant différents niveaux d'expertise.

Entailment textuel pour l’extraction d’arguments d’événements : approches à zéro et faible supervision avec apprentissage multi-source | Articles de recherche récents | HyperAI