2달 전

DataGpt-SQL-7B: 텍스트를 SQL로 변환하는 오픈 소스 언어 모델

Wu, Lixia ; Li, Peng ; Lou, Junhong ; Fu, Lei
DataGpt-SQL-7B: 텍스트를 SQL로 변환하는 오픈 소스 언어 모델
초록

자연어 쿼리를 SQL 명령으로 변환하는 핵심적인 역할에 대해 다루면서, 우리는 비전문 사용자가 데이터 접근 및 분석을 민주화하고, 폐쇄 소스 대형 언어 모델과 관련된 위험을 완화할 수 있도록 컴팩트한 미세 조정(fine-tuned) 모델들과 자기 개선(self-refine) 메커니즘들을 제안합니다. 구체적으로, Text-to-SQL 및 선호도(preference) 데이터셋을 위한 2만 건 이상의 샘플 데이터셋을 구성하여 SQL 생성 영역에서 효율성을 향상시켰습니다. 코드 유효성을 더욱 보장하기 위해 코드 수정기(code corrector)가 모델에 통합되었습니다. 우리의 시스템인 DataGpt-sql은 spider-dev 테스트에서 87.2%의 정확도를 달성하여, 텍스트-투-SQL 변환 작업에서 우리 솔루션의 효과성을 입증하였습니다. 우리의 코드, 데이터, 그리고 모델들은 \url{https://github.com/CainiaoTechAi/datagpt-sql-7b}에서 확인할 수 있습니다.

DataGpt-SQL-7B: 텍스트를 SQL로 변환하는 오픈 소스 언어 모델 | 최신 연구 논문 | HyperAI초신경