2달 전
쿼리 중심 추상적 요약: 쿼리 관련성, 다중 문서 커버리지 및 요약 길이 제약을 seq2seq 모델에 통합하기
Tal Baumel; Matan Eyal; Michael Elhadad

초록
질의 중심 요약(Query Focused Summarization, QFS)은 주로 추출적 방법을 사용하여 다루어져 왔습니다. 그러나 이러한 방법들은 생성된 텍스트가 일관성이 낮다는 문제를 가지고 있습니다. 본 연구에서는 이러한 제한을 극복하기 위해 추상적 방법이 QFS에 어떻게 적용될 수 있는지 조사하였습니다. 최근 신경망 기반 어텐션 모델을 사용한 시퀀스-투-시퀀스(sequence-to-sequence) 모델의 발전으로, 추상적 일반 단일 문서 요약 작업에서 최고 수준의 결과가 도출되었습니다. 이러한 모델들은 대량의 학습 데이터를 사용하여 엔드-투-엔드 방식으로 훈련됩니다. 우리는 QFS에 추상적 요약을 적용하기 위해 세 가지 측면을 다루었습니다: (a) 학습 데이터가 없는 경우, 사전 훈련된 추상적 모델에 질의 관련성을 통합합니다; (b) 기존 추상적 모델들이 단일 문서 설정에서 훈련되었기 때문에, QFS의 다중 문서 요구사항 내에서 추상적 모델들을 포함시키는 반복적인 방법을 설계합니다; (c) 우리가 적응시키는 추상적 모델들은 특정 길이(약 100단어)의 텍스트를 생성하도록 훈련되었지만, 우리는 다른 크기(약 250단어)의 출력을 목표로 하므로, 생성된 요약문의 목표 크기를 주어진 비율에 맞게 조정하는 방법을 설계하였습니다.우리는 DUC QFS 데이터셋에서 추출적 베이스라인과 다양한 방식으로 결합된 추상적 모델들과 비교하였으며, ROUGE 성능 지표에서 실질적인 개선을 보였음을 입증하였습니다.