TypeSQL : Génération de texte en SQL basée sur les connaissances et sensible aux types

L'interaction avec les bases de données relationnelles à travers le langage naturel permet aux utilisateurs de tout horizon d'interroger et d'analyser facilement une grande quantité de données. Cela nécessite un système capable de comprendre les questions des utilisateurs et de les convertir automatiquement en requêtes SQL. Dans cet article, nous présentons une nouvelle approche, TypeSQL, qui considère ce problème comme une tâche de remplissage de slots. De plus, TypeSQL utilise des informations de type pour mieux comprendre les entités rares et les nombres dans les questions formulées en langage naturel. Nous avons testé cette idée sur l'ensemble de données WikiSQL et surpassé l'état de l'art précédent avec une amélioration de 5,5 % en beaucoup moins de temps. Nous montrons également que l'accès au contenu des bases de données peut considérablement améliorer les performances lorsque les requêtes des utilisateurs ne sont pas bien formées. TypeSQL atteint une précision de 82,6 %, soit une amélioration absolue de 17,5 % par rapport au modèle précédent sensible au contenu.