HyperAIHyperAI
vor 2 Monaten

MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL

Gorti, Satya Krishna ; Gofman, Ilan ; Liu, Zhaoyan ; Wu, Jiapeng ; Vouitsis, Noël ; Yu, Guangwei ; Cresswell, Jesse C. ; Hosseinzadeh, Rasa
MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL
Abstract

Die Text-to-SQL-Generierung ermöglicht es Laien, über natürliche Sprache mit Datenbanken zu interagieren. Neueste Fortschritte basieren auf großen, proprietären Modellen wie dem GPT-4, die Herausforderungen in Bezug auf Zugänglichkeit, Datenschutz und Latenz aufwerfen. Um diese Probleme anzugehen, konzentrieren wir uns auf die Entwicklung kleinerer, effizienterer und quelloffener Text-to-SQL-Modelle. Wir zeigen die Vorteile des Samplens mehrerer potenzieller SQL-Generierungen und stellen unsere Methode, MSc-SQL, vor, um diese mithilfe assoziierter Metadaten zu kritisieren. Unser Modell zur Kritik von Stichproben bewertet gleichzeitig mehrere Ausgaben und erzielt verglichen mit anderen quelloffenen Modellen Spitzenleistungen, während es bei deutlich geringeren Kosten wettbewerbsfähig bleibt gegenüber größeren Modellen. Der vollständige Code ist unter https://github.com/layer6ai-labs/msc-sql abrufbar.

MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL | Neueste Forschungsarbeiten | HyperAI