2달 전
CHASE-SQL: 텍스트-SQL 변환에서 다중 경로 추론 및 선호도 최적화된 후보 선택
Pourreza, Mohammadreza ; Li, Hailong ; Sun, Ruoxi ; Chung, Yeounoh ; Talaei, Shayan ; Kakkar, Gaurav Tarlok ; Gan, Yu ; Saberi, Amin ; Ozcan, Fatma ; Arik, Sercan O.

초록
대형 언어 모델(LLM)의 텍스트-투-SQL 작업 성능 문제를 해결하기 위해, 우리는 CHASE-SQL이라는 새로운 프레임워크를 소개합니다. 이 프레임워크는 테스트 시간 컴퓨팅을 활용한 다중 에이전트 모델링을 통해 후보 생성 및 선택을 개선하는 혁신적인 전략을 사용합니다. CHASE-SQL은 LLM의 내재적 지식을 활용하여 다양한 고품질의 SQL 후보들을 생성하며, 이를 위해 다음과 같은 방법들을 사용합니다: (1) 단일 LLM 호출에서 복잡한 쿼리를 관리 가능한 하위 쿼리로 분해하는 분할-통합 방법; (2) 데이터베이스 엔진이 실행 중에 취하는 단계를 반영하는 쿼리 실행 계획 기반의 사슬적 사고 추론; (3) 특정 몇 가지 예시를 테스트 질문에 맞게 조정하여 제공하는 고유한 인스턴스 인식 합성 예제 생성 기술.최적의 후보를 식별하기 위해, 세부 조정된 이진 후보 선택 LLM을 사용하여 후보들 간의 짝짓기 비교를 수행하는 선택 에이전트가 활용됩니다. 이 선택 접근법은 다른 방법들보다 더 강건함을 입증하였습니다. 제안된 생성자-선택자 프레임워크는 SQL 쿼리의 품질과 다양성을 높이는 것뿐만 아니라, 기존 방법들을 능가하는 성능을 보여줍니다. 전체적으로, 제안된 CHASE-SQL은 유명한 BIRD 텍스트-투-SQL 데이터셋 벤치마크의 테스트 세트와 개발 세트에서 각각 73.0%와 73.01%의 최고 수준 실행 정확도를 달성하여, 논문 제출 시점에서 리더보드 상위 제출작으로 등록되었습니다.