17일 전

다중문서 요약을 위한 결정점 과정 주의 메커니즘

{Mirella Lapata, Laura Perez-Beltrachini}
초록

다수 문서 요약에서 관련성 있고 다양한 정보를 효과적으로 전달하는 능력은 매우 중요하지만, 기존의 신경망 시퀀스-투-시퀀스(seq-to-seq) 모델은 출력이 종종 반복적이며 중요한 세부 정보를 정확히 포괄하지 못하는 문제를 겪고 있다. 본 연구에서는 관련성과 다양성을 더 잘 반영하도록 유도하는 주의 메커니즘(attention mechanism)을 제안한다. 이 주의 메커니즘은 요약 대상 콘텐츠 단위 집합 위에서 정의된 결정성 점 프로세스(Determinantal Point Processes, DPPs)에 의해 주어지는 (비례) 확률을 기반으로 주의 가중치를 계산한다. DPP는 기존에 추출형 요약(extractive summarization)에서 성공적으로 활용된 기법이지만, 본 연구에서는 신경망 추상형 요약(abstractive summarization)을 위한 관련성 있고 다양한 콘텐츠 선택에 DPP를 활용한다. 제안한 DPP 기반 주의 메커니즘은 CNN부터 LSTM, Transformer에 이르기까지 다양한 seq-to-seq 아키텍처와 통합하여 적용하였다. 실험 결과, 제안한 주의 메커니즘이 다수 문서 요약 성능을 일관되게 향상시키며, MultiNews 데이터셋에서 최신 기술(SOTA, state-of-the-art) 수준의 성능을 달성함을 확인하였다.

다중문서 요약을 위한 결정점 과정 주의 메커니즘 | 최신 연구 논문 | HyperAI초신경