HyperAIHyperAI
il y a 2 mois

DataGpt-SQL-7B : Un modèle de langage open-source pour la conversion du texte en SQL

Wu, Lixia ; Li, Peng ; Lou, Junhong ; Fu, Lei
DataGpt-SQL-7B : Un modèle de langage open-source pour la conversion du texte en SQL
Résumé

En abordant le rôle crucial de la traduction des requêtes en langage naturel en commandes SQL, nous proposons une suite de modèles compacts et affinés ainsi que des mécanismes d'auto-révision pour démocratiser l'accès et l'analyse des données pour les utilisateurs non experts, atténuant les risques associés aux grands modèles linguistiques à source fermée. Plus précisément, nous avons construit un ensemble de données composé de plus de 20 000 échantillons pour la tâche Texte-vers-SQL, ainsi qu'un ensemble de données de préférences, afin d'améliorer l'efficacité dans le domaine de la génération SQL. Pour garantir davantage la validité du code, un correcteur de code a été intégré au modèle. Notre système, DataGpt-sql, a atteint une précision de 87,2 % sur l'ensemble de validation Spider (spider-dev), démontrant ainsi l'efficacité de notre solution dans les tâches de conversion texte-vers-SQL. Notre code, nos données et nos modèles sont disponibles à l'adresse suivante : \url{https://github.com/CainiaoTechAi/datagpt-sql-7b}