16일 전
HER를 통한 독해: 인간 독해를 영감으로 한 추출형 요약
{Feiyang Pan, Yan Song, Xiang Ao, Min Yang, Qing He, Ling Luo}

초록
이 연구에서는 장문 문서에 대한 추출형 텍스트 요약 문제를 재검토한다. 우리는 인간이 요약을 생성하는 과정이 두 단계로 나뉘는 것을 관찰한다. 첫째, 개략적인 독해 단계에서 요약에 필요한 개요 정보를 탐색하고, 둘째, 보다 신중한 독해 단계를 통해 핵심 문장을 선별하여 요약을 구성하는 것이다. 이러한 이중 단계적 과정을 모방함으로써, 우리는 추출형 요약을 위한 새로운 접근법을 제안한다. 본 문제를 맥락 기반 밴디트(contextual-bandit) 문제로 공식화하고, 정책 그래디언트(policy gradient) 기법을 통해 해결한다. 개략적 독해를 위해 컨볼루션 신경망을 사용하여 단락의 핵심 내용을 인코딩하고, 보다 정교한 독해를 위한 의사결정 정책과 적응형 종료 메커니즘을 도입한다. CNN 및 DailyMail 데이터셋에 대한 실험 결과, 제안하는 방법은 다양한 길이의 고품질 요약을 생성할 수 있으며, ROUGE 지표에서 기존 최고 수준의 추출형 요약 방법들을 상당히 능가함을 확인할 수 있었다.