HyperAIHyperAI
vor 2 Monaten

DataGpt-SQL-7B: Ein Open-Source-Sprachmodell für Text-to-SQL

Wu, Lixia ; Li, Peng ; Lou, Junhong ; Fu, Lei
DataGpt-SQL-7B: Ein Open-Source-Sprachmodell für Text-to-SQL
Abstract

Im Hinblick auf die zentrale Rolle der Übersetzung von natürlichsprachlichen Abfragen in SQL-Befehle schlagen wir eine Reihe kompakter, feingetuner Modelle und Selbstverbesserungsmechanismen vor, um den Zugang zu Daten und deren Analyse für Laienbenutzer zu demokratisieren und damit die Risiken abzumildern, die mit proprietären großen Sprachmodellen verbunden sind. Insbesondere haben wir einen Datensatz mit über 20.000 Beispielen für Text-zu-SQL sowie einen Präferenzdatensatz erstellt, um die Effizienz im Bereich der SQL-Generierung zu verbessern. Um die Gültigkeit des Codes weiterhin sicherzustellen, wurde ein Codekorrektor in das Modell integriert. Unser System, DataGpt-sql, erreichte eine Genauigkeit von 87,2 % auf dem Spider-Dev-Datensatz, was die Wirksamkeit unserer Lösung bei Text-zu-SQL-Konvertierungsaufgaben unterstreicht. Unser Code, unsere Daten und unsere Modelle sind unter \url{https://github.com/CainiaoTechAi/datagpt-sql-7b} verfügbar.

DataGpt-SQL-7B: Ein Open-Source-Sprachmodell für Text-to-SQL | Neueste Forschungsarbeiten | HyperAI