Command Palette
Search for a command to run...
MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL
MSc-SQL: Mehrproben-Kritik kleiner Sprachmodelle für Text-to-SQL
Satya Krishna Gorti Ilan Gofman Zhaoyan Liu Jiapeng Wu Noël Vouitsis Guangwei Yu Jesse C. Cresswell Rasa Hosseinzadeh
Zusammenfassung
Die Text-to-SQL-Generierung ermöglicht es Laien, über natürliche Sprache mit Datenbanken zu interagieren. Neueste Fortschritte basieren auf großen, proprietären Modellen wie dem GPT-4, die Herausforderungen in Bezug auf Zugänglichkeit, Datenschutz und Latenz aufwerfen. Um diese Probleme anzugehen, konzentrieren wir uns auf die Entwicklung kleinerer, effizienterer und quelloffener Text-to-SQL-Modelle. Wir zeigen die Vorteile des Samplens mehrerer potenzieller SQL-Generierungen und stellen unsere Methode, MSc-SQL, vor, um diese mithilfe assoziierter Metadaten zu kritisieren. Unser Modell zur Kritik von Stichproben bewertet gleichzeitig mehrere Ausgaben und erzielt verglichen mit anderen quelloffenen Modellen Spitzenleistungen, während es bei deutlich geringeren Kosten wettbewerbsfähig bleibt gegenüber größeren Modellen. Der vollständige Code ist unter https://github.com/layer6ai-labs/msc-sql abrufbar.