17일 전
RAT-SQL: 텍스트-SQL 파서를 위한 관계 인지 스키마 인코딩 및 링킹
Bailin Wang, Richard Shin, Xiaodong Liu, Oleksandr Polozov, Matthew Richardson

초록
데이터베이스에서 질문에 대한 답변을 위해 자연어 질문을 SQL 쿼리로 변환할 때, 현재의 의미 구문 분석 모델은 미처 경험하지 못한 데이터베이스 스키마에 일반화하는 데 어려움을 겪는다. 이러한 일반화 문제는 (a) 의미 분석기에서 접근 가능한 방식으로 데이터베이스 관계를 인코딩하는 데 있으며, (b) 주어진 질문 내에서 데이터베이스 컬럼과의 언급 간의 정렬을 모델링하는 데 있다. 본 연구에서는 관계 인지(self-attention) 기반의 유일한 프레임워크를 제안하여 텍스트-SQL 인코더 내에서 스키마 인코딩, 스키마 링킹, 그리고 특징 표현을 통합적으로 해결한다. 도전적인 Spider 데이터셋에서 이 프레임워크는 정확 일치 정확도를 57.2%로 향상시켜 기존 최고 성능 모델보다 8.7%의 절대적 개선을 달성한다. 또한 BERT를 추가로 통합함으로써 Spider 리더보드에서 새로운 최고 성능인 65.6%를 기록하였다. 더불어 모델의 스키마 링킹 및 정렬 이해 능력에서 정성적 개선도 관찰되었다. 본 연구의 구현 코드는 https://github.com/Microsoft/rat-sql에서 오픈소스로 제공될 예정이다.