HyperAIHyperAI

Command Palette

Search for a command to run...

Distillation d'ensemble Bayésienne maximale pour l'analyse AMR

Young-Suk Lee Ramon Fernandez Astudillo Thanh Lam Hoang Tahira Naseem Radu Florian Salim Roukos

Résumé

La transformation syntaxique des représentations sémantiques (AMR) a connu une augmentation sans précédent de ses performances au cours des trois dernières années, en raison d’un ensemble de facteurs incluant des améliorations architecturales et l’apprentissage par transfert. Les techniques d’apprentissage auto-supervisé ont également contribué à cette progression. Toutefois, pour la plupart des parseurs récents à haut rendement, l’effet de l’apprentissage auto-supervisé et de l’augmentation de données par « silver » semble désormais s’atténuer. Dans ce papier, nous proposons de surmonter cette décroissance des rendements apportés par les données silver en combinant des techniques d’ensemblage basées sur Smatch avec une distillation d’ensemblage. Dans un cadre expérimental étendu, nous atteignons un nouveau record de performance pour les parseurs monolinguistiques en anglais, avec des scores respectifs de 85,9 (AMR2.0) et 84,3 (AMR3.0), tout en retrouvant des gains significatifs grâce à l’augmentation de données par « silver ». Nous obtenons également un nouveau record pour la tâche de parseur AMR multilingue, sur les langues chinoise, allemande, italienne et espagnole. Enfin, nous étudions l’impact de la technique proposée sur l’adaptation de domaine, et montrons qu’elle permet d’obtenir des gains comparables à ceux des données annotées par des humains sur le corpus QALD-9, tout en atteignant un nouveau record sur le jeu de données BioAMR.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp