11일 전
주제 인식형 대조 학습을 통한 추상적 대화 요약
Junpeng Liu, Yanyan Zou, Hainan Zhang, Hongshen Chen, Zhuoye Ding, Caixia Yuan, Xiaojie Wang

초록
뉴스 기사나 백과사전 기사와 같이 구조화된 텍스트와 달리, 대화 내용은 일반적으로 두 명 이상의 대화자 간에 정보를 주고받으며 진행된다. 이러한 상황에서 대화의 주제는 진행 과정에 따라 변화할 수 있으며, 특정 주제에 대한 핵심 정보는 다양한 발화자들의 여러 발화에 분산되어 나타나는 경우가 많다. 이는 대화 요약 작업에서 요약의 정확성과 포괄성을 확보하는 데 큰 도전을 제기한다. 본 연구는 대화의 다양한 주제 정보를 효과적으로 포착하고, 포착된 주제에 대해 핵심 사실을 정리하기 위해, 일관성 탐지(coherence detection)와 하위 요약 생성(sub-summary generation)이라는 두 가지 주제 인식형 대조 학습 목표를 제안한다. 이러한 목표들은 대화 요약 작업에서 주제 변화를 암묵적으로 모델링하고, 정보의 산재 문제를 해결하는 데 기여할 것으로 기대된다. 제안된 대조 학습 목표들은 주요 대화 요약 작업의 보조 과제로 설계되었으며, 교대 매개변수 업데이트 전략을 통해 통합된다. 기준 데이터셋에서 실시한 광범위한 실험 결과, 제안된 간단한 방법이 강력한 기준 모델들을 크게 상회하며 새로운 최고 성능(SOTA)을 달성함을 입증하였다. 코드와 학습된 모델은 \href{https://github.com/Junpliu/ConDigSum}{https://github.com/Junpliu/ConDigSum}를 통해 공개되어 있다.