2달 전

Seq2SQL: 자연어를 사용하여 강화학습을 통해 구조화된 쿼리를 생성하기

Victor Zhong; Caiming Xiong; Richard Socher
Seq2SQL: 자연어를 사용하여 강화학습을 통해 구조화된 쿼리를 생성하기
초록

세계의 상당한 양의 지식은 관계형 데이터베이스에 저장되어 있습니다. 그러나 사용자가 데이터베이스에서 사실을 검색하는 능력은 SQL과 같은 쿼리 언어에 대한 이해 부족으로 제한됩니다. 우리는 자연어 질문을 해당 SQL 쿼리로 번역하기 위한 깊은 신경망인 Seq2SQL을 제안합니다. 우리의 모델은 SQL 쿼리의 구조를 활용하여 생성된 쿼리의 출력 공간을 크게 줄입니다. 또한, 데이터베이스에서 실행되는 in-the-loop 쿼리를 통해 보상을 사용하여 순서가 없는 쿼리 부분을 생성하는 정책을 학습하는데, 이 부분들은 교차 엔트로피 손실을 통한 최적화에 적합하지 않다는 것을 보여줍니다. 더불어, 우리는 위키피디아에서 추출된 24,241개의 테이블에 걸쳐 80,654개의 수작업 주석이 달린 질문과 SQL 쿼리 예제를 포함하는 데이터셋인 WikiSQL(위키SQL)을 공개할 것입니다. 이 데이터셋은 우리의 모델을 훈련시키는 데 필요하며, 유사한 데이터셋들보다 한 자릿수 이상 크습니다. WikiSQL에 쿼리 실행 환경을 적용한 정책 기반 강화학습을 통해 우리의 모델 Seq2SQL은 주의 메커니즘 기반 시퀀스-투-시퀀스 모델보다 우수한 성능을 보여주며, 실행 정확도를 35.9%에서 59.4%로, 논리적 형태 정확도를 23.4%에서 48.3%로 개선했습니다.

Seq2SQL: 자연어를 사용하여 강화학습을 통해 구조화된 쿼리를 생성하기 | 최신 연구 논문 | HyperAI초신경