템플릿-오더 데이터 증강을 통한 어спект 감성 쿼드 예측 향상

최근 들어, 아спект 수준 감성 분석 분야에서 아спект 감성 쿼드 예측(ASQP)이 주목받는 작업으로 부상하고 있다. 기존의 연구들은 원문 문장을 특정 템플릿을 통해 구조화된 목표 시퀀스로 재작성함으로써, (아спект 카테고리, 아спект 용어, 의견 용어, 감성 극성) 형태의 4요소 쿼드러플을 쉽게 디코딩할 수 있도록 하였다. 이 템플릿은 네 가지 요소를 고정된 순서로 배치한다. 그러나 우리는 이 방식이 ASQP 작업의 순서 무관성(oder-free property)과 모순됨을 관찰한다. 왜냐하면 쿼드러플이 정확하게 추출된다면 템플릿의 순서를 고정할 필요가 없기 때문이다. 이러한 관찰을 바탕으로, 우리는 템플릿 순서의 영향을 탐구하였으며, 일부 순서가 생성형 모델의 성능 향상에 기여함을 발견하였다. 이는 다양한 순서가 쿼드러플에 대해 서로 다른 시각을 제공하기 때문일 것으로 추측된다. 따라서 우리는 가장 적절한 순서를 식별하는 간단하면서도 효과적인 방법을 제안하고, 이를 바탕으로 여러 적절한 템플릿을 활용해 데이터 증강(data augmentation)을 수행함으로써 ASQP 작업의 성능을 향상시키는 방안을 제시한다. 구체적으로, 사전 훈련된 언어 모델을 사용하여 엔트로피가 최소화되는 순서를 선택한다. 이러한 템플릿 순서를 활용해 사전 훈련된 언어 모델을 미세 조정(fine-tuning)함으로써, 본 연구는 쿼드 예측 성능을 개선하였으며, 특히 자원이 제한된(low-resource) 환경에서 최신 기술(SOTA)을 상회하는 성능을 보였다.