2달 전
DR-BiLSTM: 종속 읽기 양방향 LSTM을 이용한 자연어 추론
Reza Ghaeini; Sadid A. Hasan; Vivek Datla; Joey Liu; Kathy Lee; Ashequl Qadir; Yuan Ling; Aaditya Prakash; Xiaoli Z. Fern; Oladimeji Farri

초록
우리는 자연어 추론(Natural Language Inference, NLI) 작업을 해결하기 위한 새로운 딥 러닝 아키텍처를 제시합니다. 기존 접근 방식은 대부분 전제와 가설을 독립적으로 인코딩하기 위해 단순한 읽기 메커니즘에 의존하고 있습니다. 이에 대신, 우리는 인코딩 및 추론 과정에서 전제와 가설 사이의 관계를 효과적으로 모델링하기 위한 새로운 종속적 읽기 양방향 LSTM 네트워크(Dependent Reading Bidirectional LSTM, DR-BiLSTM)를 제안합니다. 또한, 우리가 제안한 모델들을 결합하는 고도화된 앙상블 전략을 소개하며, 이는 최종 예측 성능을 크게 향상시키는 것으로 나타났습니다. 마지막으로, 추가적인 사전 처리 단계를 통해 결과가 더욱 개선될 수 있는 방법을 설명합니다. 우리의 평가는 DR-BiLSTM이 단일 모델과 앙상블 모델 모두에서 최고의 성능을 보여주며, 스탠퍼드 NLI 데이터셋에서 새로운 최고 수준의 점수를 달성함을 입증합니다.