11일 전

SADGA: 텍스트-to-SQL을 위한 구조 인지 이중 그래프 집계 네트워크

Ruichu Cai, Jinjie Yuan, Boyan Xu, Zhifeng Hao
SADGA: 텍스트-to-SQL을 위한 구조 인지 이중 그래프 집계 네트워크
초록

텍스트-SQL(Task)는 자연어로 표현된 질문을 SQL 쿼리로 변환하는 것을 목표로 하며, 최근 많은 주목을 받고 있다. 텍스트-SQL의 가장 도전적인 문제 중 하나는 훈련된 모델이 미리 보지 못한 데이터베이스 스키마에 일반화될 수 있도록 하는 것, 즉 크로스도메인 텍스트-SQL 작업이다. 이 문제의 핵심은 (i) 질문과 데이터베이스 스키마를 모델링하기 위한 인코딩 방법의 일반화 가능성과 (ii) 질문과 데이터베이스 스키마 내 테이블/컬럼 간 단어 간 맵핑을 학습하는 질문-스키마 연결 방법의 일반화 가능성에 있다. 위 두 가지 핵심 문제에 초점을 맞추어, 크로스도메인 텍스트-SQL 작업을 위한 구조 인지형 이중 그래프 집계 네트워크(SADGA: Structure-Aware Dual Graph Aggregation Network)를 제안한다. SADGA에서는 자연어 질문과 데이터베이스 스키마 모두에 대해 통합적인 인코딩 모델을 제공하기 위해 그래프 구조를 채택한다. 제안된 통합 모델 기반으로, 질문-그래프와 스키마-그래프 간의 맵핑을 학습하기 위한 구조 인지형 집계 방법을 추가로 설계하였다. 이 구조 인지형 집계 방법은 글로벌 그래프 연결(Global Graph Linking), 로컬 그래프 연결(Local Graph Linking), 이중 그래프 집계 메커니즘(Dual-Graph Aggregation Mechanism)을 특징으로 한다. 본 연구는 제안 방법의 성능을 실험적으로 평가하였으며, 작성 시점에서 도전적인 텍스트-SQL 벤치마크인 스파이더(Spider)에서 3위를 달성하였다.