2 个月前

DataGpt-SQL-7B:一个用于文本到SQL转换的开源语言模型

Wu, Lixia ; Li, Peng ; Lou, Junhong ; Fu, Lei
DataGpt-SQL-7B:一个用于文本到SQL转换的开源语言模型
摘要

在解决将自然语言查询转换为SQL命令这一关键问题时,我们提出了一套紧凑且经过微调的模型以及自修正机制,旨在使非专家用户能够民主化地访问和分析数据,从而减轻与闭源大型语言模型相关的风险。具体而言,我们构建了一个包含超过20,000个样本的Text-to-SQL数据集以及偏好数据集,以提高SQL生成领域的效率。为了进一步确保代码的有效性,我们将一个代码校正器集成到了模型中。我们的系统DataGpt-sql在Spider-dev测试集上达到了87.2%的准确率,展示了我们在文本到SQL转换任务中的解决方案的有效性。我们的代码、数据和模型可在以下网址获取:https://github.com/CainiaoTechAi/datagpt-sql-7b

DataGpt-SQL-7B:一个用于文本到SQL转换的开源语言模型 | 最新论文 | HyperAI超神经