17일 전
RYANSQL: 다중 도메인 데이터베이스에서 복잡한 텍스트-to-SQL에 대한 스키치 기반 슬롯 채움의 반복적 적용
DongHyun Choi, Myeong Cheol Shin, EungGyun Kim, Dong Ryeol Shin

초록
Text-to-SQL은 사용자 질문과 데이터베이스가 주어졌을 때, 해당 질문을 SQL 쿼리로 변환하는 문제이다. 본 논문에서는 다중 도메인 데이터베이스에 대한 복잡한 Text-to-SQL 작업을 해결하기 위해 RYANSQL(Recursively Yielding Annotation Network for SQL)이라는 신경망 기반 접근법을 제안한다. 중첩된 SQL 쿼리를 비중첩 SELECT 문의 집합으로 변환하기 위해 문장 위치 코드(Statement Position Code, SPC)를 정의하였으며, SPC에 대응하는 각 SELECT 문을 합성하기 위해 스키치 기반의 슬롯 채우기 접근법을 제안하였다. 또한, 생성 성능을 추가로 향상시키기 위해 두 가지 입력 조작 방법을 제시하였다. RYANSQL은 도전적인 Spider 벤치마크에서 58.2%의 정확도를 달성하여 기존 최고 성능 기법 대비 3.2%p 향상시켰으며, 작성 시점 기준으로 Spider 리더보드에서 1위를 기록하고 있다.