HyperAIHyperAI
il y a 17 jours

RAT-SQL : Encodage et liaison des schémas conscients des relations pour les parseurs Text-to-SQL

Bailin Wang, Richard Shin, Xiaodong Liu, Oleksandr Polozov, Matthew Richardson
RAT-SQL : Encodage et liaison des schémas conscients des relations pour les parseurs Text-to-SQL
Résumé

Lors de la traduction de questions en langage naturel en requêtes SQL pour répondre à des interrogations sur une base de données, les modèles contemporains de traitement sémantique peinent à généraliser à des schémas de bases de données inconnus. Le défi de généralisation réside dans (a) encoder les relations de la base de données de manière accessible au parseur sémantique, et (b) modéliser l’alignement entre les colonnes de la base de données et leurs mentions dans une requête donnée. Nous proposons un cadre unifié, fondé sur un mécanisme d’attention auto-orientée aux relations, pour traiter l’encodage du schéma, le lien avec le schéma et la représentation des caractéristiques au sein d’un encodeur texte- vers-SQL. Sur le dataset exigeant Spider, ce cadre améliore le taux de précision exacte à 57,2 %, surpassant ses meilleurs prédécesseurs de 8,7 points absolus. En l’associant à BERT, il atteint une performance nouvelle référence de 65,6 % sur le classement Spider. Par ailleurs, nous observons des améliorations qualitatives dans la compréhension du modèle du lien avec le schéma et de l’alignement. Notre implémentation sera rendue open-source à l’adresse suivante : https://github.com/Microsoft/rat-sql.