HyperAIHyperAI

Command Palette

Search for a command to run...

CHESS : Harnais Contextuel pour une Synthèse Efficace de SQL

Shayan Talaei Mohammadreza Pourreza Yu-Chen Chang Azalia Mirhoseini Amin Saberi

Résumé

La traduction de questions en langage naturel en requêtes SQL, connue sous le nom de text-to-SQL, est un problème de recherche de longue date. La synthèse efficace de text-to-SQL peut devenir très complexe en raison de (i) la taille considérable des catalogues de bases de données (descriptions des tables et de leurs colonnes) et des valeurs de base de données, (ii) la nécessité d'effectuer des raisonnements sur des schémas de base de données importants, (iii) l'assurance de la validité fonctionnelle des requêtes générées, et (iv) la gestion des ambiguïtés des questions en langage naturel. Nous présentons CHESS, un cadre multi-agents basé sur un grand modèle linguistique (LLM) pour une synthèse SQL efficace et évolutive, composé de quatre agents spécialisés, chacun ciblant l'un des défis mentionnés : l'Agent Récupérateur d'Informations (IR) extrait les données pertinentes, l'Agent Sélecteur de Schéma (SS) réduit les grands schémas, l'Agent Générateur de Candidats (CG) génère des candidats de haute qualité et affine les requêtes itérativement, et l'Agent Testeur d'Unités (UT) valide les requêtes à travers des tests unitaires en langage naturel basés sur LLM. Notre cadre offre des fonctionnalités configurables qui s'adaptent à diverses contraintes de déploiement, notamment :1) Le support des bases de données industrielles : grâce à l'agent Sélecteur de Schéma, CHESS réduit efficacement les grands schémas de base de données en sous-schémas gérables, améliorant ainsi la précision du système d'environ 2% et réduisant le nombre de jetons LLM par un facteur 5.2) Des performances préservant la confidentialité à la pointe du secteur : parmi les méthodes utilisant des modèles open source, CHESS atteint des performances à la pointe du secteur, offrant un système performant et respectueux de la vie privée adapté au déploiement industriel.3) Évolutivité avec un budget informatique supplémentaire : dans les configurations disposant d'un budget informatique élevé, CHESS atteint une précision de 71.10% sur l'ensemble BIRD test, soit moins de 2% derrière la méthode propriétaire leader tout en nécessitant environ 83% moins d'appels LLM.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp