
초록
신경망 기반 추상적 요약 방법은 다른 기술보다 유창한 결과물을 생성하지만, 내용 선택에 있어서는 부족할 수 있다. 본 연구에서는 이 문제를 해결하기 위한 간단한 기법을 제안한다: 데이터 효율적인 내용 선택기를 사용하여 요약에 포함되어야 하는 원문서의 구문들을 과도하게 결정(over-determine)하는 것이다. 우리는 이 선택기를 하향식(bottom-up) 주의 단계로 활용하여 모델이 가능성이 높은 구문들에 집중하도록 제약한다. 실험 결과, 이 접근 방식은 텍스트 압축 능력을 개선하면서도 여전히 유창한 요약을 생성할 수 있음을 보여준다. 이러한 두 단계 과정은 다른 엔드투엔드(end-to-end) 내용 선택 모델보다 더 간단하고 성능이 우수하여, CNN-DM 및 NYT 코퍼스에서 ROUGE 점수가 크게 향상되었다. 또한, 내용 선택기는 1,000개의 문장으로도 학습될 수 있어, 훈련된 요약 생성기가 새로운 영역으로 쉽게 전환될 수 있다.