HyperAIHyperAI
il y a 11 jours

Knowledge-to-SQL : Amélioration de la génération de requêtes SQL grâce à un LLM expert en données

Zijin Hong, Zheng Yuan, Hao Chen, Qinggang Zhang, Feiran Huang, Xiao Huang
Knowledge-to-SQL : Amélioration de la génération de requêtes SQL grâce à un LLM expert en données
Résumé

La génération de requêtes SQL précises à partir de questions utilisateur (texte vers SQL) constitue un défi persistant, car elle exige une compréhension approfondie à la fois de la question posée par l’utilisateur et de la structure correspondante de la base de données afin de récupérer les informations souhaitées avec exactitude. Les méthodes existantes s’appuient sur la capacité globale des grands modèles linguistiques (LLM) pour produire les requêtes SQL. Toutefois, certaines connaissances essentielles ne sont pas explicitement présentes dans la structure de la base de données ni dans la question utilisateur, bien qu’elles aient pu être acquises par les LLM. Par conséquent, les requêtes SQL générées pour des questions manquant de ces connaissances peuvent être inexactes, ce qui nuit négativement à la performance et à la robustesse des modèles texte-vers-SQL. Pour relever ce défi, nous proposons le cadre Knowledge-to-SQL, qui utilise un modèle linguistique spécialisé, appelé Data Expert LLM (DELLM), afin d’apporter des connaissances pertinentes à tous les modèles texte-vers-SQL. Plus précisément, nous détaillons l’implémentation du DELLM en ce qui concerne la lecture des tables ainsi que le processus de fine-tuning de base. Nous introduisons également une stratégie de apprentissage par préférences fondée sur un retour de base de données (PLDBF), permettant d’affiner le DELLM afin qu’il génère des connaissances encore plus utiles pour les LLM. Des expériences étendues montrent que le DELLM améliore les approches de pointe dans les tâches texte-vers-SQL. Le code correspondant au DELLM est mis à disposition pour favoriser de futures recherches.

Knowledge-to-SQL : Amélioration de la génération de requêtes SQL grâce à un LLM expert en données | Articles de recherche récents | HyperAI