HIE-SQL : Réseau à Information Historique Renforcée pour l'Analyse Sémantique Texte-Vers-SQL Dépendante du Contexte

Récemment, la transformation contextuelle du texte en SQL, qui consiste à traduire un langage naturel en requêtes SQL au cours d’un processus interactif, a attiré une attention croissante. Les travaux antérieurs exploitaient soit les informations contextuelles issues des énoncés de l’historique d’interaction, soit les requêtes SQL prédites précédemment, mais échouaient à tirer parti des deux sources simultanément en raison du décalage entre le langage naturel et la forme logique des requêtes SQL. Dans ce travail, nous proposons un modèle de transformation texte-en-SQL amélioré par l’information historique (HIE-SQL), conçu pour exploiter efficacement les informations contextuelles provenant à la fois des énoncés historiques et de la dernière requête SQL prédite. Face à ce décalage, nous traitons le langage naturel et le SQL comme deux modalités distinctes, et proposons un modèle pré-entraîné bimodal afin de réduire l’écart entre elles. Par ailleurs, nous avons conçu un graphe de liaison au schéma pour renforcer les connexions entre les énoncés, la requête SQL et le schéma de base de données. Nous démontrons que nos méthodes améliorant l’information historique permettent d’améliorer de manière significative les performances du modèle HIE-SQL, qui atteint des résultats nouveaux et meilleurs que les états de l’art sur deux benchmarks contextuels de transformation texte-en-SQL, à savoir les jeux de données SparC et CoSQL, au moment de la rédaction de ce travail.