2달 전

자연어 추론을 위한 분해 가능한 주의 모델

Ankur P. Parikh; Oscar Täckström; Dipanjan Das; Jakob Uszkoreit
자연어 추론을 위한 분해 가능한 주의 모델
초록

우리는 자연어 추론을 위한 간단한 신경망 구조를 제안합니다. 본 접근 방식은 주의 메커니즘을 사용하여 문제를 별도로 해결할 수 있는 하위 문제들로 분해하므로, 이는 당연히 병렬 처리가 가능하게 됩니다. 스탠퍼드 자연어 추론(SNLI) 데이터셋에서, 우리는 이전 연구보다 거의 한 자릿수 적은 매개변수로 최고 수준의 결과를 얻었으며, 단어 순서 정보에 의존하지 않았습니다. 문장 내부 주의 메커니즘을 추가하여 최소한의 순서 정보를 고려하면 더욱 개선됩니다.