
초록
우리는 고객 리뷰의 문장을 계층적 이산 잠재 공간으로 인코딩한 후, 그 인코딩의 빈도를 기반으로 일반적인 의견을 식별하는 비지도 감정 요약 방법을 제안합니다. 우리는 이러한 빈번한 인코딩을 디코딩하여 추상적 요약을 생성하고, 동일한 빈번한 인코딩에 할당된 문장을 선택하여 추출적 요약을 생성할 수 있습니다. 우리의 방법은 모델이 요약 생성 과정의 일부로 사용되는 문장을 식별하기 때문에 귀인 가능(attributable)입니다. 또한, 잠재 공간에서 집계가 수행되므로 토큰 시퀀스가 긴 경우에도 수백 건의 입력 리뷰에 쉽게 확장됩니다. 우리는 또한 모델을 원하는 측면(예: 위치 또는 음식)에 해당하는 인코딩 공간의 일부로 제한함으로써 측면별 요약을 생성할 수 있는 일정한 제어 능력을 보여줍니다. 두 개의 서로 다른 도메인 데이터셋에 대한 자동 평가와 인간 평가는 우리의 방법이 이전 연구보다 더 정보가 풍부하고 입력 리뷰에 더 잘 근거된 요약을 생성함을 입증합니다.