XiYan-SQL의 개요: 텍스트-투-SQL을 위한 다중 생성기 앙상블 프레임워크

대형 언어 모델이 자연어를 SQL로 변환하는 작업에서 직면한 문제를 해결하기 위해, 우리는 XiYan-SQL이라는 혁신적인 프레임워크를 소개합니다. 이 프레임워크는 후보 생성을 개선하기 위해 다중 생성기 앙상블 전략을 사용합니다. 또한 데이터베이스 구조의 이해를 향상시키기 위해 반구조화된 스키마 표현 방법인 M-Schema를 제안합니다. 후보 SQL 쿼리의 품질과 다양성을 높이기 위해, XiYan-SQL은 문맥 내 학습(In-Context Learning, ICL)의 잠재력을 감독된 미세 조정과 결합시킵니다.한편으로는, 우리는 다양한 선호도를 가진 고품질 후보를 생성하기 위한 일련의 훈련 전략을 제안합니다. 다른 한편으로는, 명명된實體 인식을 기반으로 예제 선택 방법을 사용하여 ICL 접근 방식을 구현하여 실체에 대한过渡强조를 방지합니다(실체에 대한 과도한 강조 방지를 위해 명명된實體 인식 기반 예제 선택 방법을 사용하여 ICL 접근 방식을 구현했습니다).후보 각각의 논리적 또는 구문적 오류를 수정하여 최적화하는 리파이너가 있습니다. 최고의 후보를 식별하는 문제를 해결하기 위해, 우리는 후보 SQL 쿼리 간의 미묘한 차이점을 구분할 수 있는 선택 모델을 미세 조정하였습니다.여러方言데이터셋에서 수행한 실험 결과는 XiYan-SQL이 다양한 시나리오에서 도전 과제를 해결하는 데 있어 견고함을 입증하였습니다(여러方言데이터셋에서 수행한 실험 결과는 XiYan-SQL이 다양한 시나리오에서 도전 과제를 해결하는 데 있어 견고함을 입증하였습니다). 전체적으로, 제안된 XiYan-SQL은 Bird 벤치마크에서 75.63%, Spider 테스트 세트에서 89.65%, SQL-Eval에서 69.86%, NL2GQL에서 41.20%의 최고 수준 실행 정확도를 달성하였습니다.제안된 프레임워크는 SQL 쿼리의 품질과 다양성을 향상시키는 것뿐만 아니라, 이전 방법들을 능가하는 성능을 보여주었습니다.注:在翻译中,"實體"(实体)和"方言"(方言)这两个词并不常见于韩语科技文献中,因此我保留了中文并添加了英文注释。正确的韩语术语应该是“엔티티”和“다이얼렉트”,但为了确保信息完整,我在括号中标注了原文。