HyperAIHyperAI
il y a 17 jours

Apprentissage de parseurs sémantiques à partir de denotations avec des alignements structurés latents et des programmes abstraits

Bailin Wang, Ivan Titov, Mirella Lapata
Apprentissage de parseurs sémantiques à partir de denotations avec des alignements structurés latents et des programmes abstraits
Résumé

La parssage sémantique vise à mapper des énoncés en langage naturel vers des représentations sémantiques interprétables par une machine, aussi appelées programmes dont l’exécution dans un environnement du monde réel produit une dénotation. Les parseurs sémantiques faiblement supervisés sont entraînés sur des paires énoncé-dénotation, en traitant les programmes comme des variables latentes. Ce problème est particulièrement difficile en raison de l’immensité de l’espace de recherche et de la présence de programmes spuriants — ceux-ci peuvent produire la bonne réponse sur des exemples vus, mais échouent à généraliser à des exemples non vus. Notre objectif consiste à introduire un biais inductif dans le parseur afin de l’aider à distinguer les programmes corrects des programmes spuriants. Nous exploitons l’intuition selon laquelle les programmes corrects respectent probablement certaines contraintes structurelles lorsqu’ils sont alignés avec la question (par exemple, des fragments de programme sont peu susceptibles d’être alignés sur des segments textuels chevauchants), et proposons de modéliser les alignements comme des variables latentes structurées. Afin de rendre le cadre à alignement latent traitable, nous décomposons la tâche de parsing en deux étapes : (1) prédire un « programme abstrait » partiel, puis (2) le raffiner tout en modélisant les alignements structurés à l’aide d’un algorithme de programmation dynamique différentiable. Nous atteignons des performances de pointe sur les jeux de données WIKITABLEQUESTIONS et WIKISQL. En comparaison avec une base standard utilisant l’attention, nous constatons que le mécanisme d’alignement structuré proposé s’avère particulièrement bénéfique.

Apprentissage de parseurs sémantiques à partir de denotations avec des alignements structurés latents et des programmes abstraits | Articles de recherche récents | HyperAI