2달 전

BanditSum: 문맥적 밴딧으로서 추출 요약

Yue Dong; Yikang Shen; Eric Crawford; Herke van Hoof; Jackie Chi Kit Cheung
BanditSum: 문맥적 밴딧으로서 추출 요약
초록

본 연구에서는 휴리스틱으로 생성된 추출적 라벨 없이 단일 문서 추출 요약을 수행하기 위한 새로운 방법을 제안합니다. 이 접근법을 BanditSum(バンディットサム)이라고 명명하였는데, 이는 추출 요약을 컨텍스트 밴디트(CB, Contextual Bandit) 문제로 다루기 때문입니다. 여기서 모델은 요약해야 하는 문서(컨텍스트)를 받고, 요약에 포함할 문장 시퀀스(액션)를 선택합니다. 정책 그래디언트 강화 학습 알고리즘을 사용하여 모델이 ROUGE 점수를 최대화하는 문장 시퀀스를 선택하도록 훈련시킵니다. 일련의 실험을 통해 BanditSum이 추출 요약 분야에서 최신 기술과 비교해 더 나은 또는 유사한 ROUGE 점수를 달성할 수 있음을 보여주며, 경쟁 방식보다 현저히 적은 업데이트 단계로 수렴함을 입증하였습니다. 또한, BanditSum이 원문서의 후반부에 좋은 요약 문장이 등장할 때 경쟁 방식보다 상당히 우수한 성능을 발휘함을 경험적으로 확인하였습니다.

BanditSum: 문맥적 밴딧으로서 추출 요약 | 최신 연구 논문 | HyperAI초신경