17일 전

RAT-SQL: 텍스트-SQL 파서를 위한 관계 인지 스키마 인코딩 및 링킹

Bailin Wang, Richard Shin, Xiaodong Liu, Oleksandr Polozov, Matthew Richardson
RAT-SQL: 텍스트-SQL 파서를 위한 관계 인지 스키마 인코딩 및 링킹
초록

데이터베이스에서 질문에 대한 답변을 위해 자연어 질문을 SQL 쿼리로 변환할 때, 현재의 의미 구문 분석 모델은 미처 경험하지 못한 데이터베이스 스키마에 일반화하는 데 어려움을 겪는다. 이러한 일반화 문제는 (a) 의미 분석기에서 접근 가능한 방식으로 데이터베이스 관계를 인코딩하는 데 있으며, (b) 주어진 질문 내에서 데이터베이스 컬럼과의 언급 간의 정렬을 모델링하는 데 있다. 본 연구에서는 관계 인지(self-attention) 기반의 유일한 프레임워크를 제안하여 텍스트-SQL 인코더 내에서 스키마 인코딩, 스키마 링킹, 그리고 특징 표현을 통합적으로 해결한다. 도전적인 Spider 데이터셋에서 이 프레임워크는 정확 일치 정확도를 57.2%로 향상시켜 기존 최고 성능 모델보다 8.7%의 절대적 개선을 달성한다. 또한 BERT를 추가로 통합함으로써 Spider 리더보드에서 새로운 최고 성능인 65.6%를 기록하였다. 더불어 모델의 스키마 링킹 및 정렬 이해 능력에서 정성적 개선도 관찰되었다. 본 연구의 구현 코드는 https://github.com/Microsoft/rat-sql에서 오픈소스로 제공될 예정이다.