HyperAIHyperAI

Command Palette

Search for a command to run...

MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL

Satya Krishna Gorti Ilan Gofman Zhaoyan Liu Jiapeng Wu Noël Vouitsis Guangwei Yu Jesse C. Cresswell Rasa Hosseinzadeh

Zusammenfassung

Die Text-to-SQL-Generierung ermöglicht es Laien, über natürliche Sprache mit Datenbanken zu interagieren. Neueste Fortschritte basieren auf großen, proprietären Modellen wie dem GPT-4, die Herausforderungen in Bezug auf Zugänglichkeit, Datenschutz und Latenz aufwerfen. Um diese Probleme anzugehen, konzentrieren wir uns auf die Entwicklung kleinerer, effizienterer und quelloffener Text-to-SQL-Modelle. Wir zeigen die Vorteile des Samplens mehrerer potenzieller SQL-Generierungen und stellen unsere Methode, MSc-SQL, vor, um diese mithilfe assoziierter Metadaten zu kritisieren. Unser Modell zur Kritik von Stichproben bewertet gleichzeitig mehrere Ausgaben und erzielt verglichen mit anderen quelloffenen Modellen Spitzenleistungen, während es bei deutlich geringeren Kosten wettbewerbsfähig bleibt gegenüber größeren Modellen. Der vollständige Code ist unter https://github.com/layer6ai-labs/msc-sql abrufbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL | Paper | HyperAI