HyperAIHyperAI
il y a 11 jours

RESDSQL : Découplage du lien de schéma et de l'analyse syntaxique squelettique pour la transformation texte-vers-SQL

Haoyang Li, Jing Zhang, Cuiping Li, Hong Chen
RESDSQL : Découplage du lien de schéma et de l'analyse syntaxique squelettique pour la transformation texte-vers-SQL
Résumé

L'une des dernières approches les plus prometteuses en matière de Text-to-SQL repose sur les modèles linguistiques pré-entraînés. En raison de la structure intrinsèque des requêtes SQL, les modèles seq2seq sont chargés de parser à la fois les éléments du schéma (c’est-à-dire les tables et les colonnes) et le squelette (c’est-à-dire les mots-clés SQL). Ce couplage des cibles augmente significativement la difficulté de la génération correcte de requêtes SQL, particulièrement lorsque celles-ci impliquent de nombreux éléments de schéma et des opérateurs logiques complexes. Ce papier propose un cadre amélioré basé sur un encodage renforcé par classement et une décodage conscient du squelette, afin de découpler la liaison au schéma et le parsing du squelette. Plus précisément, pour un modèle seq2seq à encodage et décodage, l’encodeur est enrichi par les éléments de schéma les plus pertinents, plutôt que par l’ensemble désordonné des éléments du schéma, ce qui réduit l’effort nécessaire pour la liaison au schéma durant le processus de génération. Quant au décodeur, il génère d’abord le squelette de la requête SQL, puis la requête complète, ce qui impose implicitement une contrainte structurée sur le processus de génération. Nous évaluons notre cadre proposé sur Spider ainsi que sur ses trois variantes de robustesse : Spider-DK, Spider-Syn et Spider-Realistic. Les résultats expérimentaux montrent que notre approche atteint des performances prometteuses et une robustesse accrue. Le code source est disponible à l’adresse suivante : https://github.com/RUCKBReasoning/RESDSQL.

RESDSQL : Découplage du lien de schéma et de l'analyse syntaxique squelettique pour la transformation texte-vers-SQL | Articles de recherche récents | HyperAI