
초록
정서 인식(Emotion Recognition, ER)은 건강 및 웰빙에서부터 저자 프로파일링, 소비자 분석, 보안에 이르기까지 실-world 응용 분야에서 큰 영향을 미치기 때문에 자연어 처리(Natural Language Processing, NLP)에서 중요한 과제로 여겨진다. 기존의 ER 접근 방식은 주로 정서를 독립적으로 분류하는 방식을 채택하고 있으며, 정서가 동시에 존재할 수 있다는 점을 고려하지 않는다. 이러한 접근은 여러 정서가 겹치는 상황에서 발생할 수 있는 잠재적 모호성을 간과하게 된다. 본 연구에서는 다중 레이블 정서 분류를 스팬 예측(span-prediction) 문제로 재정의한 새로운 모델인 'SpanEmo'를 제안한다. 이 모델은 문장 내 단어와 레이블 간의 관계를 학습하는 데 도움을 주어 ER 모델의 성능을 향상시킬 수 있다. 더불어, 입력 문장 내에서 동시에 존재하는 다수의 정서를 효과적으로 모델링할 수 있도록 특화된 손실 함수(loss function)를 도입하였다. SemEval2018 다중 레이블 정서 데이터셋을 대상으로 영어, 아랍어, 스페인어 등 세 가지 언어셋에서 수행한 실험을 통해 본 방법의 효과성을 입증하였다. 마지막으로, 제안된 방법이 모델 성능 향상에 기여하고 문장 내 정서 클래스와 단어 간의 의미 있는 연관성을 효과적으로 학습할 수 있음을 보여주는 다양한 분석 결과를 제시한다.