HyperAIHyperAI

Command Palette

Search for a command to run...

Sur la généralisation dans la résolution de coréférence

Shubham Toshniwal Patrick Xia Sam Wiseman Karen Livescu Kevin Gimpel

Résumé

Bien que la résolution de coreférence soit définie indépendamment du domaine des données, la plupart des modèles proposés pour effectuer cette tâche ne se transforment pas efficacement vers des domaines inédits. Nous rassemblons un ensemble de 8 jeux de données de résolution de coreférence ciblant des domaines différents afin d’évaluer les performances « out-of-the-box » des modèles. Ensuite, nous combinons trois de ces jeux de données pour l’entraînement ; bien que leurs domaines, leurs directives d’annotation et leurs métadonnées diffèrent, nous proposons une méthode permettant d’entraîner un seul modèle de manière conjointe sur cette combinaison hétérogène de données, en utilisant une augmentation de données pour tenir compte des différences d’annotation et un échantillonnage pour équilibrer les quantités de données. Nous constatons qu’en configuration zéro-shot, les modèles entraînés sur un seul jeu de données se transforment mal, tandis que l’entraînement conjoint permet d’obtenir des performances globales améliorées, conduisant à une meilleure généralisation des modèles de résolution de coreférence. Ce travail contribue ainsi à un nouveau benchmark pour la résolution de coreférence robuste ainsi qu’à plusieurs nouveaux résultats état-de-l’art.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp