Génération de requêtes SQL à partir de texte améliorée par le contenu basée sur BERT

Nous présentons une méthode simple visant à exploiter le contenu des tables afin d’améliorer les modèles basés sur BERT pour résoudre le problème text-to-SQL. À partir de l’observation selon laquelle certains éléments du contenu des tables correspondent à des mots présents dans la question, et que certains en-têtes de table coïncident également avec des mots de la question, nous introduisons deux vecteurs de caractéristiques supplémentaires dans le modèle profond. Notre approche permet également d’accélérer l’inférence du modèle au moment du test, puisque les tables sont pratiquement identiques entre les phases d’entraînement et de test. Nous évaluons notre modèle sur le jeu de données WikiSQL et surpassons la version basée sur BERT de référence de 3,7 % en précision logique et de 3,7 % en précision d’exécution, atteignant ainsi un état de l’art.