리더의 의견을 통합한 추출적 텍스트 요약

신경망 추상적 요약 분야에서, 기존의 시퀀스-투-시퀀스(sequence-to-sequence) 기반 모델들은 주요 측면에 대해 문서의 잘못된 측면을 요약하는 문제를 자주 겪습니다. 이 문제를 해결하기 위해, 우리는 독자 의견을 활용하여 모델이 주요 측면에 대해 더 나은 요약을 생성하도록 돕는 독자 인식 추상적 요약 생성 작업을 제안합니다. 전통적인 추상적 요약 작업과 달리, 독자 인식 요약은 두 가지 주요 도전 과제를 직면하고 있습니다: (1) 의견은 비격식적이며 노이즈가 많습니다; (2) 뉴스 문서와 독자 의견을 동시에 모델링하는 것이 어렵습니다. 이러한 도전 과제들을 해결하기 위해, 우리는 네 가지 구성 요소로 이루어진 독자 인식 요약 생성기(reader-aware summary generator, RASG)라는 적대적 학습 모델을 설계하였습니다: (1) 시퀀스-투-시퀀스 기반 요약 생성기; (2) 독자가 집중한 측면을 포착하는 독자 주의 모듈; (3) 생성된 요약과 독자가 집중한 측면 사이의 의미 차이를 모델링하는 감독자; (4) 각 생성 단계에서 목표를 생성하는 목표 추적기. 감독자와 목표 추적기는 적대적 방식으로 우리의 프레임워크 학습을 안내하는 데 사용됩니다. 대규모 실세계 텍스트 요약 데이터셋에서 광범위한 실험을 수행하였으며, 결과는 RASG가 자동 평가 지표와 인간 평가 모두에서 최고 수준의 성능을 달성함을 보여주었습니다. 실험 결과는 또한 우리 프레임워크 내 각 모듈의 효과성을 입증하였습니다. 우리는 추가 연구를 위해 대규모 데이터셋을 공개합니다.