2달 전
SyntaxSQLNet: 복잡하고 다중 영역의 텍스트-투-SQL 작업을 위한 구문 트리 네트워크
Tao Yu; Michihiro Yasunaga; Kai Yang; Rui Zhang; Dongxu Wang; Zifan Li; Dragomir Radev

초록
텍스트-투-SQL 작업에서 대부분의 기존 연구는 여러 절이나 하위 쿼리를 포함하는 복잡한 SQL 쿼리 생성과 새로운, 보지 못한 데이터베이스에 대한 일반화를 요구하지 않습니다. 본 논문에서는 이러한 복잡하고 다중 도메인 텍스트-투-SQL 생성 작업을 해결하기 위해 구문 트리 네트워크인 SyntaxSQLNet을 제안합니다. SyntaxSQLNet은 SQL 전용 구문 트리 기반 디코더와 SQL 생성 경로 이력, 테이블 인식 열 주의 인코더를 사용합니다. 우리는 여러 테이블과 여러 SQL 절 및 중첩된 쿼리를 포함하는 복잡한 SQL 쿼리를 포함하는 Spider 텍스트-투-SQL 작업에서 SyntaxSQLNet을 평가합니다. 테스트 세트의 데이터베이스가 학습 중에 보지 못한 상태로 설정되는 데이터베이스 분할 방식을 사용했습니다. 실험 결과, SyntaxSQLNet은 이전 연구보다 상당히 많은 수의 복잡한 SQL 예제를 처리할 수 있으며, 정확도에서 이전 최고 모델보다 7.3% 높은 성능을 보였습니다. 또한, 다중 도메인 증강 방법을 사용하여 성능을 추가로 7.5% 개선시킬 수 있음을 보여주어, 전체적으로 14.8%의 성능 개선 효과를 얻었습니다. 우리 소견으로는, 우리는 이러한 복잡하고 다중 도메인 텍스트-투-SQL 작업에 대해 처음으로 연구를 수행하였습니다.