2달 전
추상적 텍스트 요약을 위한 시퀀스-투-시퀀스 RNN 및 그 이상의 활용
Ramesh Nallapati; Bowen Zhou; Cicero Nogueira dos santos; Caglar Gulcehre; Bing Xiang

초록
본 연구에서는 어텐션 기반 인코더-디코더 순환 신경망(Attentional Encoder-Decoder Recurrent Neural Networks)을 사용하여 추상적 텍스트 요약(abstractive text summarization)을 모델링하고, 두 개의 다른 코퍼스에서 최고 수준의 성능을 달성함을 보여줍니다. 우리는 기본 아키텍처가 충분히 모델링하지 못하는 요약에서 중요한 문제들을 해결하기 위한 여러 가지 새로운 모델들을 제안합니다. 예를 들어, 주요 단어(key-words) 모델링, 문장-단어 구조의 계층성을 포착(capturing the hierarchy of sentence-to-word structure), 그리고 학습 시에 드물거나 나타나지 않은 단어들을 생성(emitting words that are rare or unseen at training time) 등의 문제들이 포함됩니다. 본 연구는 제안된 많은 모델들이 성능 향상에 기여함을 입증합니다. 또한, 다중 문장 요약(multi-sentence summaries)으로 구성된 새로운 데이터셋을 제안하고, 후속 연구를 위한 성능 벤치마크를 설정하였습니다.