16일 전
T5-SR: 의미 구문 분석을 위한 통합적 시퀀스-투-시퀀스 디코딩 전략
Yuntao Li, Zhenpeng Su, Yutian Li, Hanchu Zhang, Sirui Wang, Wei Wu, Yan Zhang

초록
최근 자연어 질의를 시퀀스-투-시퀀스(sequence-to-sequence, seq2seq) 방식으로 SQL로 변환하는 작업에 대한 관심이 높아지고 있다. 그러나 추상적 문법 구조 트리 기반의 SQL 생성 방식과 비교했을 때, seq2seq 기반의 의미 분석기(semantic parser)는 스키마 정보 예측의 낮은 품질과 자연어 질의와 SQL 간의 의미 일관성 부족 등 더 큰 도전에 직면해 있다. 본 논문은 이러한 문제들을 분석하고, 위의 과제를 각각 해결하기 위해 새로운 중간 표현 형태인 SSQL과 점수 재추정기(score re-estimator)를 활용한 재정렬(reranking) 방법을 포함하는 seq2seq 지향적 디코딩 전략인 SR을 제안한다. 실험 결과를 통해 제안한 기법들의 효과성을 입증하였으며, T5-SR-3b 모델은 Spider 데이터셋에서 새로운 최고 성능(SOTA, state-of-the-art)을 달성하였다.