11일 전
지식 기반 SQL 생성: 데이터 전문 LLM을 활용한 SQL 생성 향상
Zijin Hong, Zheng Yuan, Hao Chen, Qinggang Zhang, Feiran Huang, Xiao Huang

초록
사용자 질문에 대한 정확한 SQL 쿼리 생성(텍스트-SQL)은 사용자의 질문과 관련 데이터베이스 스키마에 대한 깊이 있는 이해가 필요하기 때문에 오랫동안 도전 과제로 남아왔다. 기존의 방법들은 대규모 언어 모델(LLM)의 종합적 능력을 활용하여 SQL을 생성하는 데 의존하고 있다. 그러나 일부 필수 지식은 데이터베이스 스키마나 사용자 질문에 명시적으로 포함되어 있지 않거나, LLM이 학습한 내용일 수 있다. 따라서 지식이 부족한 질문에 대해 생성된 SQL은 정확하지 않을 수 있으며, 이는 텍스트-SQL 모델의 성능과 견고성에 부정적인 영향을 미칠 수 있다. 이러한 문제를 해결하기 위해 우리는 모든 텍스트-SQL 모델이 유용한 지식을 제공받을 수 있도록 맞춤형 데이터 전문가 LLM(DELMM)을 활용하는 지식-SQL 프레임워크를 제안한다. 구체적으로 DELLM의 테이블 읽기 및 기본 미세조정 과정에 대한 세부 구현 방식을 제시한다. 또한 데이터베이스 피드백을 통한 선호도 학습(PLDBF) 전략을 제안하여 DELLM이 LLM에게 더 유용한 지식을 생성하도록 개선한다. 광범위한 실험을 통해 DELLM이 최첨단 텍스트-SQL 작업을 향상시킬 수 있음을 검증하였으며, 관련 코드는 향후 연구를 위해 공개되었다.