Génération de requêtes SQL basée sur l'édition pour des questions contextuelles dépendantes inter-domaines

Nous nous concentrons sur la tâche de génération de texte en SQL dépendante du contexte et inter-domaines. Partant de l'observation que les questions en langage naturel adjacentes sont souvent linguistiquement liées et que leurs requêtes SQL correspondantes ont tendance à se chevaucher, nous utilisons l'historique des interactions en modifiant la requête prédite précédemment pour améliorer la qualité de la génération. Notre mécanisme d'édition considère le SQL comme des séquences et réutilise les résultats de génération au niveau des jetons (tokens) de manière simple. Il est flexible pour modifier individuellement les jetons et robuste face à la propagation des erreurs. De plus, pour traiter les structures de tables complexes dans différents domaines, nous utilisons un encodeur d'énoncé-table et un décodeur sensible aux tables afin d'intégrer le contexte de l'énoncé utilisateur et du schéma de table. Nous évaluons notre approche sur le jeu de données SParC et démontrons l'avantage de l'édition par rapport aux méthodes de référence actuelles qui génèrent le SQL à partir de zéro. Notre code est disponible à l'adresse suivante : https://github.com/ryanzhumich/sparc_atis_pytorch.