HyperAIHyperAI
il y a 13 jours

Prédiction structurée comme traduction entre langues naturelles augmentées

Giovanni Paolini, Ben Athiwaratkun, Jason Krone, Jie Ma, Alessandro Achille, Rishita Anubhai, Cicero Nogueira dos Santos, Bing Xiang, Stefano Soatto
Prédiction structurée comme traduction entre langues naturelles augmentées
Résumé

Nous proposons un nouveau cadre, appelé Traduction entre Langues Naturelles Augmentées (TANL), afin de résoudre de nombreuses tâches de prédiction structurée en langage naturel, notamment l'extraction conjointe d'entités et de relations, la reconnaissance d'entités nommées imbriquées, la classification de relations, l'étiquetage sémantique des rôles, l'extraction d'événements, la résolution de coreférences et le suivi d'état de dialogue. Au lieu d'aborder ce problème par l'entraînement de classificateurs discriminatifs spécifiques à chaque tâche, nous le reformulons comme une tâche de traduction entre langues naturelles augmentées, permettant ainsi une extraction aisée des informations pertinentes pour la tâche. Notre approche atteint ou dépasse les performances des modèles spécialisés sur toutes les tâches, et en particulier établit de nouveaux records sur l'extraction conjointe d'entités et de relations (jeux de données CoNLL04, ADE, NYT et ACE2005), la classification de relations (FewRel et TACRED) et l'étiquetage sémantique des rôles (CoNLL-2005 et CoNLL-2012). Ces résultats sont obtenus tout en utilisant la même architecture et les mêmes hyperparamètres pour toutes les tâches, y compris dans le cas d'un apprentissage multi-tâches où un seul modèle est entraîné simultanément pour toutes les tâches. Enfin, nous démontrons que notre cadre permet également d'améliorer significativement les performances dans un régime à faible ressource, grâce à une utilisation plus efficace des sémantiques des étiquettes.