
초록
본 논문에서는 추출형 요약 작업을 개선하기 위해 문서의 내재된 세그멘테이션 구조를 활용한다. 우리는 두 개의 텍스트 세그멘테이션 모델을 구축하고, 이들의 예측 결과를 추출형 요약 모델에 도입하는 가장 최적의 전략을 탐색한다. 과학 논문 코퍼스를 대상으로 한 실험 결과, 매우 정확한 세그멘테이션 방법을 사용할 경우 추출형 요약 성능이 향상됨을 확인할 수 있다. 특히, 가장 중요한 정보가 문서의 처음 부분에 있지 않은 경우에 있어서 성능 향상이 가장 두드러지며, 이는 세그멘테이션 기법이 리드 편향(lead bias) 문제를 완화하는 데 기여함을 시사한다.