11일 전

대화 내 감정 인식을 위한 맥락 의존적 임베딩 발화 표현

Patrícia Pereira, Helena Moniz, Isabel Dias, Joao Paulo Carvalho
대화 내 감정 인식을 위한 맥락 의존적 임베딩 발화 표현
초록

대화 내 정서 인식(Emotion Recognition in Conversations, ERC)은 대화형 에이전트가 점점 더 보편화되면서 그 중요성이 더욱 커지고 있다. 정서를 정확히 인식하는 것은 효과적인 소통을 위해 필수적이며, 효과적이고 공감 능력을 갖춘 대화형 에이전트 개발에 핵심적인 요소로 작용한다. 대화 상황에 대한 지식과 이해는 대화 상대방의 정서를 식별하는 데 매우 유용하다. 따라서 본 연구는 대화 상황, 즉 이전 대화 턴들을 고려하여 ERC 문제에 접근한다. 기존의 대화 상황 모델링 방법은 각 발화에 대해 상황에 독립적인 표현을 생성한 후, 이를 바탕으로 상황적 특성을 모델링하는 방식이었다. 본 연구에서는 사전 훈련된 트랜스포머 기반 언어 모델의 강력한 상황 표현 능력을 활용하여, 각 발화에 대해 상황에 의존적인 임베딩 표현을 제안한다. 제안하는 방법은 분류 대상 발화에 이전 대화 턴들을 결합한 전체 대화 맥락을 RoBERTa 인코더에 입력하고, 이를 통해 얻어진 임베딩에 간단한 분류 모듈을 추가하는 방식이다. 이로 인해 임베딩을 얻은 후 별도로 상황을 처리할 필요가 없으며, 이미 효율적인 상황 표현이 포함된 임베딩을 확보할 수 있다. 또한, 도입하는 대화 턴 수가 모델 성능에 미치는 영향을 탐구한다. 제안한 방법의 효과성은 개방형 대화 데이터셋인 DailyDialog 및 작업 지향형 데이터셋인 EmoWOZ에서 검증되었다.

대화 내 감정 인식을 위한 맥락 의존적 임베딩 발화 표현 | 최신 연구 논문 | HyperAI초신경