11일 전
Transformer 기반 언어 모델을 활용한 추출형 및 생성형 신경 문서 요약에 관한 연구
Sandeep Subramanian, Raymond Li, Jonathan Pilault, Christopher Pal

초록
긴 문서(수천 단어를 초과하는)에 대한 추상적 요약을 생성하기 위한 방법을 제안한다. 본 연구에서는 요약 생성 전에 간단한 추출적 단계를 수행한 후, 해당 정보를 기반으로 트랜스포머 기반 언어 모델이 관련 정보에 조건을 부여한 후 요약을 생성하도록 한다. 실험을 통해 이 추출적 단계가 요약 성능을 크게 향상시킴을 입증한다. 또한, 복사 메커니즘을 사용하는 기존 방법과 비교하여 더 추상적인 요약을 생성하면서도 더 높은 ROUGE 점수를 달성함을 보여준다. 참고: 위의 초록은 저자들이 작성한 것이 아니라, 본 논문에서 제시된 모델 중 하나에 의해 생성된 것이다.