CHESS : Harnais Contextuel pour une Synthèse Efficace de SQL

La traduction de questions en langage naturel en requêtes SQL, connue sous le nom de text-to-SQL, est un problème de recherche de longue date. La synthèse efficace de text-to-SQL peut devenir très complexe en raison de (i) la taille considérable des catalogues de bases de données (descriptions des tables et de leurs colonnes) et des valeurs de base de données, (ii) la nécessité d'effectuer des raisonnements sur des schémas de base de données importants, (iii) l'assurance de la validité fonctionnelle des requêtes générées, et (iv) la gestion des ambiguïtés des questions en langage naturel. Nous présentons CHESS, un cadre multi-agents basé sur un grand modèle linguistique (LLM) pour une synthèse SQL efficace et évolutive, composé de quatre agents spécialisés, chacun ciblant l'un des défis mentionnés : l'Agent Récupérateur d'Informations (IR) extrait les données pertinentes, l'Agent Sélecteur de Schéma (SS) réduit les grands schémas, l'Agent Générateur de Candidats (CG) génère des candidats de haute qualité et affine les requêtes itérativement, et l'Agent Testeur d'Unités (UT) valide les requêtes à travers des tests unitaires en langage naturel basés sur LLM. Notre cadre offre des fonctionnalités configurables qui s'adaptent à diverses contraintes de déploiement, notamment :1) Le support des bases de données industrielles : grâce à l'agent Sélecteur de Schéma, CHESS réduit efficacement les grands schémas de base de données en sous-schémas gérables, améliorant ainsi la précision du système d'environ 2% et réduisant le nombre de jetons LLM par un facteur 5.2) Des performances préservant la confidentialité à la pointe du secteur : parmi les méthodes utilisant des modèles open source, CHESS atteint des performances à la pointe du secteur, offrant un système performant et respectueux de la vie privée adapté au déploiement industriel.3) Évolutivité avec un budget informatique supplémentaire : dans les configurations disposant d'un budget informatique élevé, CHESS atteint une précision de 71.10% sur l'ensemble BIRD test, soit moins de 2% derrière la méthode propriétaire leader tout en nécessitant environ 83% moins d'appels LLM.