17일 전
Aspect Sentiment Quad 예측을 위한 생성형 데이터 증강
{Naoaki Okazaki, Ao Liu, Youmi Ma, Junfeng Jiang, An Wang}

초록
Aspect Sentiment Quad 예측(ASQP)은 텍스트 내에서 관점 어절(Aspect Term), 견해 어절(Opinion Term), 감성 극성(Sentiment Polarity), 관점 카테고리(Aspect Category)를 분석하는 작업이다. 이 작업의 주요 과제 중 하나는 높은 주석 비용으로 인해 데이터의 부족 문제이다. 이를 해결하기 위해 일반적으로 데이터 증강 기법이 활용된다. 그러나 기존의 접근 방식은 훈련 데이터 내 텍스트를 단순히 재작성하는 방식으로, 생성된 데이터의 의미적 다양성을 제한하고, 텍스트와 쿼드 간의 일관성 부족으로 인해 품질이 저하되는 문제가 있다. 이러한 한계를 해결하기 위해, 본 연구에서는 쿼드를 증강하고, 쿼드를 텍스트로 변환하는 모델을 학습하여 대응하는 텍스트를 생성하는 방식을 제안한다. 또한, 저품질 데이터를 제거하고 증강 데이터셋의 샘플 난이도 분포를 균형 있게 유지하기 위한 새로운 전략을 설계하였다. 두 개의 ASQP 데이터셋에 대한 실증적 실험 결과, 제안한 방법이 기존의 데이터 증강 기법들을 모두 능가하며, 기준 벤치마크에서 최고 성능을 달성함을 입증하였다.