Aperçu de XiYan-SQL : Un cadre d'ensemble multi-générateurs pour la conversion texte-SQL

Pour relever les défis liés aux performances des grands modèles de langage dans les tâches de traduction du langage naturel vers SQL, nous présentons XiYan-SQL, un cadre innovant qui utilise une stratégie d'ensemble multi-générateur pour améliorer la génération de candidats. Nous introduisons également M-Schema, une méthode de représentation semi-structurée des schémas conçue pour renforcer la compréhension des structures de base de données. Afin d'améliorer la qualité et la diversité des requêtes SQL générées, XiYan-SQL intègre le potentiel important de l'apprentissage en contexte (ICL) avec le contrôle précis du réglage supervisé.D'une part, nous proposons une série de stratégies d'entraînement pour ajuster les modèles afin qu'ils génèrent des candidats de haute qualité avec des préférences variées. D'autre part, nous mettons en œuvre l'approche ICL avec une méthode de sélection d'exemples basée sur la reconnaissance d'entités nommées pour éviter une trop grande emphase sur les entités. Le raffineur optimise chaque candidat en corrigeant les erreurs logiques ou syntaxiques.Pour faire face au défi d'identifier le meilleur candidat, nous ajustons un modèle de sélection afin qu'il distingue les nuances entre les requêtes SQL candidates. Les résultats expérimentaux sur plusieurs jeux de données en différents dialectes démontrent la robustesse de XiYan-SQL dans la résolution des défis à travers différentes situations.Dans l'ensemble, notre cadre proposé XiYan-SQL atteint une précision d'exécution record de 75,63 % sur le banc d'essai Bird, 89,65 % sur l'ensemble de tests Spider, 69,86 % sur SQL-Eval et 41,20 % sur NL2GQL. Ce cadre non seulement améliore la qualité et la diversité des requêtes SQL mais aussi surpasses les méthodes précédentes.