
초록
추상적 텍스트 요약은 원문서에서 가장 중요한 사실을 포함하면서 긴 텍스트 문서를 인간이 읽을 수 있는 형태로 줄이는 것을 목표로 합니다. 그러나 기존 접근 방식에서 실제로 추상화된 수준, 즉 원본 문서에 나타나지 않는 새로운 구문의 비율은 여전히 낮습니다. 본 연구에서는 생성된 요약의 추상화 수준을 개선하기 위한 두 가지 기술을 제안합니다. 첫째, 디코더를 원문서의 관련 부분을 검색하는 문맥 네트워크와 언어 생성에 대한 사전 지식을 통합하는 사전 학습된 언어 모델로 분해하였습니다. 둘째, 정책 학습을 통해 직접 최적화되는 독창성 지표를 제안하여 새로운 구문의 생성을 촉진합니다. 우리의 모델은 ROUGE 점수와 인간 평가에 의해 결정된 최신 모델과 유사한 결과를 달성하면서, n-그램 중복률을 통해 측정된 추상화 수준이 현저히 높아졌습니다.