
초록
자연어 추론(Natural Language Inference, NLI) 작업은 에이전트가 자연어 전제와 자연어 가설 사이의 논리적 관계를 결정하도록 요구합니다. 본 연구에서는 상호작용 공간에서 계층적으로 의미 특징을 추출하여 문장 쌍에 대한 고차원적인 이해를 달성할 수 있는 새로운 신경망 구조인 상호작용 추론 네트워크(Interactive Inference Network, IIN)를 소개합니다. 우리는 상호작용 텐서(어텐션 가중치)가 자연어 추론을 해결하기 위한 의미 정보를 포함하고 있으며, 더 밀도 높은 상호작용 텐서가 더 풍부한 의미 정보를 포함한다는 것을 보여줍니다. 이러한 구조의 한 예인 밀도 높은 상호작용 추론 네트워크(Densely Interactive Inference Network, DIIN)는 대규모 NLI 코퍼스와 유사한 대규모 NLI 데이터셋에서 최고 수준의 성능을 보임을 입증하였습니다. 특히 DIIN은 가장 강력한 기존 시스템과 비교하여 도전적인 다중 장르 자연어 추론(Multi-Genre NLI, MultiNLI) 데이터셋에서 20% 이상의 오류 감소를 이룩하였습니다.