2달 전

반복적 교대 신경망 주의력 기계 독서를 위한 연구

Alessandro Sordoni; Philip Bachman; Adam Trischler; Yoshua Bengio

초록

우리는 문서에 대한 Cloze 스타일의 질문 응답과 같은 기계 이해 작업을 해결하기 위한 새로운 신경망 주의 구조를 제안합니다. 이전 모델들과 달리, 우리는 쿼리를 단일 벡터로 축소하지 않고, 대신 쿼리와 문서를 세밀하게 탐색할 수 있는 반복적인 교차 주의 메커니즘을 도입하였습니다. 우리의 모델은 CNN 뉴스 기사 및 어린이 책 테스트(CBT) 데이터셋과 같은 표준 기계 이해 벤치마크에서 최신 기술보다 우수한 성능을 보여주었습니다.