2달 전
다양성 주도 주의 모델을 활용한 질의 기반 추상적 요약
Preksha Nema; Mitesh Khapra; Anirban Laha; Balaraman Ravindran

초록
추상적 요약(abstractive summarization)은 문서의 주요 포인트를 간결하고 일관된 방식으로 더 짧은 버전으로 생성하는 것을 목표로 합니다. 반면, 질의 기반 요약(query-based summarization)은 주어진 질의의 맥락에서 관련 있는 포인트들을 강조합니다. 인코더-어텐션-디코더 패러다임(encode-attend-decode paradigm)은 기계 번역, 추출적 요약, 대화 시스템 등에서 뚜렷한 성공을 거두었습니다. 그러나 이 방법은 반복되는 문구를 생성하는 문제점이 있습니다. 본 연구에서는 인코더-어텐션-디코더 패러다임에 두 가지 핵심 추가 기능을 포함하여 질의 기반 요약 작업을 위한 모델을 제안합니다. 첫째, 시간 단계별로 질의의 다른 부분에 집중하도록 학습하는 질의 어텐션 모델(query attention model)(문서 어텐션 모델(document attention model) 외에도)입니다. 둘째, 요약에서 문구가 반복되는 문제를 완화하기 위해 다양성 기반 어텐션 모델(diversity based attention model)을 도입하였습니다. 이 모델의 테스트를 가능하게 하기 위해 debatepedia를 바탕으로 새로운 질의 기반 요약 데이터셋을 소개합니다. 실험 결과, 이 두 가지 추가 기능으로 인해 제안된 모델이 ROUGE-L 점수에서 28%(절대값) 상승하며, 기본적인 인코더-어텐션-디코더 모델보다 명확히 우수한 성능을 보였습니다.