11일 전

BRIO: 추상적 요약에 질서를 도입하다

Yixin Liu, Pengfei Liu, Dragomir Radev, Graham Neubig
BRIO: 추상적 요약에 질서를 도입하다
초록

요약 생성 모델은 일반적으로 최대우도추정(maximum likelihood estimation)을 사용하여 훈련되며, 이는 이상적인 모델이 참조 요약에 대해 모든 확률 질량(probability mass)을 할당해야 한다는 결정론적(일점) 타겟 분포를 전제로 한다. 그러나 이러한 가정은 추론 과정에서 참조 요약에서 벗어난 여러 시스템 생성 요약(candidate summaries)을 비교해야 할 때 성능 저하를 초래할 수 있다. 이 문제를 해결하기 위해, 우리는 다양한 후보 요약에 대해 그 품질에 따라 확률 질량을 할당할 수 있도록 비결정론적 분포를 가정하는 새로운 훈련 패러다임을 제안한다. 제안한 방법은 CNN/DailyMail(ROUGE-1 47.78) 및 XSum(ROUGE-1 49.07) 데이터셋에서 새로운 최고 성능을 달성하였다. 추가 분석을 통해 제안 모델이 후보 요약의 품질 수준과 더 높은 상관관계를 갖는 확률을 추정할 수 있음이 확인되었다.

BRIO: 추상적 요약에 질서를 도입하다 | 최신 연구 논문 | HyperAI초신경