HyperAIHyperAI
il y a 2 mois

Seq2SQL : Génération de requêtes structurées à partir du langage naturel à l'aide de l'apprentissage par renforcement

Victor Zhong; Caiming Xiong; Richard Socher
Seq2SQL : Génération de requêtes structurées à partir du langage naturel à l'aide de l'apprentissage par renforcement
Résumé

Une quantité importante des connaissances mondiales est stockée dans des bases de données relationnelles. Cependant, la capacité des utilisateurs à extraire des faits d'une base de données est limitée en raison d'un manque de compréhension des langages de requêtes tels que SQL. Nous proposons Seq2SQL, un réseau neuronal profond pour traduire les questions formulées en langage naturel en requêtes SQL correspondantes. Notre modèle exploite la structure des requêtes SQL afin de réduire considérablement l'espace de sortie des requêtes générées. De plus, nous utilisons les récompenses issues de l'exécution en boucle des requêtes sur la base de données pour apprendre une politique générant les parties non ordonnées de la requête, que nous montrons être moins adaptées à l'optimisation par perte d'entropie croisée. En outre, nous publierons WikiSQL, un ensemble de données composé de 80 654 exemples annotés à la main de questions et requêtes SQL répartis sur 24 241 tables provenant de Wikipédia. Ce jeu de données est nécessaire pour entraîner notre modèle et est d'un ordre de grandeur plus important que les jeux de données comparables. En appliquant un apprentissage par renforcement basé sur une politique avec un environnement d'exécution de requêtes à WikiSQL, notre modèle Seq2SQL surpasses les modèles séquentiels à séquence basés sur l'attention, améliorant la précision d'exécution de 35,9 % à 59,4 % et la précision du forme logique de 23,4 % à 48,3 %.

Seq2SQL : Génération de requêtes structurées à partir du langage naturel à l'aide de l'apprentissage par renforcement | Articles de recherche récents | HyperAI