2달 전
강화된 LSTM을 이용한 자연어 추론
Qian Chen; Xiaodan Zhu; Zhenhua Ling; Si Wei; Hui Jiang; Diana Inkpen

초록
추론과 유추는 인간 지능과 인공 지능의 핵심 요소입니다. 인간 언어에서의 추론 모델링은 매우 어려운 과제입니다. 대규모 주석 데이터(Bowman et al., 2015)가 제공됨에 따라 최근에는 신경망 기반 추론 모델을 훈련시키는 것이 가능해졌으며, 이러한 모델들은 매우 효과적임이 입증되었습니다. 본 논문에서는 스탠퍼드 자연어 추론 데이터셋에서 88.6%의 정확도를 달성한 새로운 최고 수준의 결과를 제시합니다. 이전 최상위 모델들이 매우 복잡한 네트워크 구조를 사용하는 것과 달리, 우리는 체인 LSTM을 기반으로 순차적인 추론 모델을 세심하게 설계함으로써 모든 이전 모델을 능가할 수 있음을 처음으로 입증하였습니다. 이를 바탕으로, 국소 추론 모델링 및 추론 조합에서 재귀 구조를 명시적으로 고려함으로써 추가적인 개선을 이루어냈습니다. 특히, 문법 분석 정보를 통합함으로써 가장 우수한 결과를 얻었습니다---이는 이미 강력한 모델에도 불구하고 성능을 더욱 향상시키는 역할을 하였습니다.