2달 전
구조화된 요약 만들기: 긴 과학 문서를 위한 다면적 요약 데이터셋
Rui Meng; Khushboo Thaker; Lei Zhang; Yue Dong; Xingdi Yuan; Tong Wang; Daqing He

초록
다면적 요약(faceted summarization)은 문서의 다양한 관점에서 간략한 보고를 제공합니다. 구조화된 개요의 도움으로 독자들은 긴 문서의 주요 내용을 빠르게 이해할 수 있습니다. 그러나 이 주제에 대한 연구는 대규모 다면적 요약 데이터셋의 부족으로 인해 아직 많이 이루어지지 않았습니다. 본 연구에서는 에메랄드 저널 논문을 기반으로 한 다면적 요약 벤치마크인 FacetSum을 소개합니다. FacetSum은 다양한 분야를 포괄하고 있으며, 전통적인 문서-요약 쌍과 달리 여러 개의 요약을 제공합니다. 각 요약은 긴 문서의 특정 부분(목적, 방법, 결과, 가치 등)을 대상으로 합니다. 우리의 데이터셋에 대한 분석 및 실증 결과는 요약에 구조를 도입하는 것이 얼마나 중요한지를 보여줍니다. 우리는 FacetSum이 요약 연구의 더 큰 발전을 촉진하고, 긴 텍스트와 요약 모두에서 구조화된 정보를 활용할 수 있는 자연어 처리(NLP) 시스템의 개발을 지원할 것이라고 믿습니다.