HyperAIHyperAI

Command Palette

Search for a command to run...

Prédiction structurée autoregressive avec des modèles linguistiques

Tianyu Liu Yuchen Jiang Nicholas Monath Ryan Cotterell Mrinmaya Sachan

Résumé

Les dernières années ont vu émerger un changement de paradigme en traitement du langage naturel (NLP) avec l’utilisation croissante des modèles pré-entraînés sur langage (PLM) pour une large gamme de tâches. Toutefois, de nombreuses décisions complexes doivent être prises pour représenter des structures (par exemple, du texte annoté, des chaînes de coréférence) de manière à ce qu’elles puissent être efficacement capturées par les PLM. Les travaux antérieurs sur la prédiction structurée avec les PLM consistent généralement à « aplatisser » la sortie structurée en une séquence, ce qui limite la qualité de l’information structurale apprise et conduit à des performances inférieures par rapport aux modèles discriminatifs classiques. Dans ce travail, nous proposons une approche permettant de modéliser les structures comme une séquence d’actions, de manière autoregressive, à l’aide des PLM, permettant ainsi d’apprendre les dépendances internes à la structure sans perte d’information. Notre méthode atteint un nouveau état de l’art sur toutes les tâches de prédiction structurée étudiées, à savoir la reconnaissance d’entités nommées, l’extraction relationnelle end-to-end et la résolution de coréférence.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp