2달 전

Multi-News: 대규모 다중 문서 요약 데이터셋 및 추상적 계층 모델

Alexander R. Fabbri; Irene Li; Tianwei She; Suyi Li; Dragomir R. Radev
Multi-News: 대규모 다중 문서 요약 데이터셋 및 추상적 계층 모델
초록

온라인 출판물이 급속히 증가함에 따라 여러 뉴스 기사에서 자동으로 요약을 생성하는 것은 매우 유용한 도구입니다. 단일 문서 요약(Single Document Summarization, SDS) 시스템은 대규모 데이터셋의 활용 가능성이 증가함에 따라 신경망 인코더-디코더 모델의 발전으로 혜택을 받았습니다. 그러나 뉴스 기사의 다중 문서 요약(Multi-Document Summarization, MDS)은 몇백 개의 예제로 구성된 데이터셋에 한정되어 왔습니다. 본 논문에서는 Multi-News라는 첫 번째 대규모 MDS 뉴스 데이터셋을 소개합니다. 또한, 전통적인 추출형 요약 모델과 표준 SDS 모델을 결합한 엔드투엔드(end-to-end) 모델을 제안하며, 이 모델은 MDS 데이터셋에서 경쟁력 있는 결과를 달성하였습니다. 우리는 Multi-News에서 여러 방법들을 벤치마킹하고, 이 작업이 다중 문서 환경에서의 요약 기술 발전을 촉진하기를 바라며 우리의 데이터와 코드를 공개합니다.

Multi-News: 대규모 다중 문서 요약 데이터셋 및 추상적 계층 모델 | 최신 연구 논문 | HyperAI초신경