2달 전
강화된 주제 인식 컨볼루션 시퀀스-투-시퀀스 모델을 이용한 추상적 텍스트 요약
Li Wang; Junlin Yao; Yunzhe Tao; Li Zhong; Wei Liu; Qiang Du

초록
본 논문에서는 주제 정보를 합성곱 시퀀스-투-시퀀스(ConvS2S) 모델에 통합하고, 자기 비판적 시퀀스 훈련(SCST)을 사용하여 최적화하는 깊은 학습 접근법을 제안합니다. 주제와 단어 수준의 정렬에 공동으로 주목함으로써, 제안된 접근법은 편향된 확률 생성 메커니즘을 통해 생성된 요약의 일관성, 다양성 및 정보성을 개선할 수 있습니다. 한편, SCST와 같은 강화학습은 미분 불가능한 지표인 ROUGE에 대해 직접 모델을 최적화하며, 추론 과정에서 노출 편향(exposure bias)을 피할 수도 있습니다. 우리는 Gigaword, DUC-2004, LCSTS 데이터셋을 사용하여 최신 방법들과의 실험 평가를 수행했습니다. 경험적인 결과는 제안된 방법이 추상적 요약(abstractive summarization)에서 우수함을 입증합니다.