HyperAIHyperAI
il y a 11 jours

PET-SQL : Une amélioration par prompt de la révision en deux étapes du texte vers SQL avec cohérence croisée

Zhishuai Li, Xiang Wang, Jingjing Zhao, Sun Yang, Guoqing Du, Xiaoru Hu, Bin Zhang, Yuxiao Ye, Ziyue Li, Rui Zhao, Hangyu Mao
PET-SQL : Une amélioration par prompt de la révision en deux étapes du texte vers SQL avec cohérence croisée
Résumé

Les avancées récentes dans le domaine du Text-to-SQL (Text2SQL) mettent l'accent sur l'encouragement des grands modèles linguistiques (LLM) à exploiter l'apprentissage in-context, obtenant des résultats significatifs. Toutefois, ces approches rencontrent des difficultés face à des informations de base de données volumineuses et à des intentions utilisateur complexes. Ce papier présente un cadre en deux étapes visant à améliorer les performances des systèmes actuels basés sur les LLM pour la conversion du langage naturel en requêtes SQL. Nous introduisons tout d'abord une nouvelle représentation de prompt, nommée représentation renforcée par référence, qui intègre des informations de schéma ainsi que des valeurs aléatoirement échantillonnées à partir des cellules des tables, afin d'instruire les LLM dans la génération de requêtes SQL. Dans une première phase, des paires question-Réponse SQL sont récupérées comme exemples peu nombreux (few-shot demonstrations), incitant le LLM à produire une requête SQL préliminaire (PreSQL). Ensuite, les entités mentionnées dans la PreSQL sont analysées afin d'effectuer un lien de schéma, permettant ainsi de condenser de manière significative les informations pertinentes. Dans une deuxième phase, en s'appuyant sur le schéma lié, nous simplifions l'information de schéma présente dans le prompt et orientons le LLM pour générer la requête SQL finale. Enfin, comme module de post-amélioration, nous proposons d'utiliser une cohérence croisée entre différents LLM plutôt que la cohérence auto-référentielle au sein d'un seul LLM. Nos méthodes atteignent de nouveaux résultats SOTA sur le benchmark Spider, avec une précision d'exécution de 87,6 %.

PET-SQL : Une amélioration par prompt de la révision en deux étapes du texte vers SQL avec cohérence croisée | Articles de recherche récents | HyperAI