2달 전
기계 이해를 위한 양방향 주의력 흐름
Minjoon Seo; Aniruddha Kembhavi; Ali Farhadi; Hannaneh Hajishirzi

초록
기계 이해(Machine Comprehension, MC)는 주어진 문맥 단락에 대한 질의에 답하기 위해 문맥과 질의 간의 복잡한 상호작용을 모델링하는 것을 필요로 합니다. 최근에 주의 메커니즘(attention mechanisms)이 MC에 성공적으로 확장되었습니다. 일반적으로 이러한 방법들은 주의를 사용하여 문맥의 작은 부분에 집중하고 고정된 크기의 벡터로 요약하며, 시간적으로 주의를 결합하거나 종종 단방향 주의를 형성합니다. 본 논문에서는 다단계 계층적 프로세스로, 다양한 수준에서 문맥을 표현하고 초기 요약 없이 질의 인식적인 문맥 표현을 얻기 위한 양방향 주의 흐름 메커니즘(bi-directional attention flow mechanism)을 사용하는 Bi-Directional Attention Flow (BIDAF) 네트워크를 소개합니다. 우리의 실험 평가 결과는 모델이 스탠퍼드 질문 답변 데이터셋(Stanford Question Answering Dataset, SQuAD) 및 CNN/데일리메일 클로즈 테스트에서 최신 기술 수준(state-of-the-art) 결과를 달성함을 보여줍니다.