2달 전

MSc-SQL: 다중 샘플 비판 소형 언어 모델을 이용한 텍스트-SQL 변환

Gorti, Satya Krishna ; Gofman, Ilan ; Liu, Zhaoyan ; Wu, Jiapeng ; Vouitsis, Noël ; Yu, Guangwei ; Cresswell, Jesse C. ; Hosseinzadeh, Rasa
MSc-SQL: 다중 샘플 비판 소형 언어 모델을 이용한 텍스트-SQL 변환
초록

텍스트-투-SQL 생성은 비전문가들이 자연어를 통해 데이터베이스와 상호작용할 수 있게 해줍니다. 최근의 발전은 GPT-4와 같은 대형 폐쇄 소스 모델에 의존하고 있어 접근성, 프라이버시, 그리고 지연 시간 측면에서 어려움을 겪고 있습니다. 이러한 문제들을 해결하기 위해 우리는 작은, 효율적인, 오픈 소스 텍스트-투-SQL 모델 개발에 초점을 맞추고 있습니다. 우리는 여러 후보 SQL 생성을 샘플링하는 이점들을 보여주며, 관련 메타데이터를 사용하여 이를 비평하는 우리의 방법인 MSc-SQL을 제안합니다. 우리의 샘플 비평 모델은 여러 출력을 동시에 평가하여 다른 오픈 소스 모델들과 비교해 최신 성능을 달성하면서도 큰 모델들보다 훨씬 낮은 비용으로 경쟁력을 유지합니다. 전체 코드는 https://github.com/layer6ai-labs/msc-sql에서 확인할 수 있습니다.

MSc-SQL: 다중 샘플 비판 소형 언어 모델을 이용한 텍스트-SQL 변환 | 최신 연구 논문 | HyperAI초신경