MSc-SQL : Critique Multi-Échantillons de Modèles Linguistiques Réduits pour la Conversion Texte-to-SQL

La génération Text-to-SQL permet aux non-experts d'interagir avec des bases de données à travers le langage naturel. Les récentes avancées s'appuient sur de grands modèles à source fermée comme le GPT-4, qui posent des défis en termes d'accessibilité, de confidentialité et de latence. Pour répondre à ces problèmes, nous nous concentrons sur le développement de petits modèles Text-to-SQL efficaces et à source ouverte. Nous démontrons les avantages de l'échantillonnage de plusieurs candidats SQL générés et proposons notre méthode, MSc-SQL, pour les critiquer en utilisant des métadonnées associées. Notre modèle d'évaluation par échantillonnage évalue simultanément plusieurs sorties, atteignant des performances de pointe comparées à d'autres modèles open-source tout en restant compétitif avec des modèles plus grands à un coût beaucoup plus faible. Le code complet est disponible sur https://github.com/layer6ai-labs/msc-sql.