11일 전

EmoWOZ: 작업 지향 대화 시스템에서 감정 인식을 위한 대규모 코퍼스 및 레이블링 체계

Shutong Feng, Nurul Lubis, Christian Geishauser, Hsien-chin Lin, Michael Heck, Carel van Niekerk, Milica Gašić
EmoWOZ: 작업 지향 대화 시스템에서 감정 인식을 위한 대규모 코퍼스 및 레이블링 체계
초록

감정을 인식할 수 있는 능력은 대화형 인공지능에 인간적인 요소를 더해줍니다. 대화형 대화(초기 대화)에서의 감정에 대한 연구는 상당한 관심을 받았지만, 과제 중심 대화에서의 감정은 여전히 거의 다뤄지지 않은 상태입니다. 이는 감정과 대화 성공이 자연스러운 시스템에서 동등한 중요성을 지닌다는 점을 고려할 때 주목할 만한 현상입니다. 기존의 감정 레이블이 부여된 과제 중심 대화 데이터셋은 규모가 작고, 레이블의 풍부함과 공개 가능성 측면에서 제한적이며, 후속 작업에 있어 병목 현상을 초래하고 있습니다. 과제 중심 대화에서 감정에 관한 연구를 위한 기반을 마련하기 위해, 우리는 과제 중심 대화의 대규모 수작업 감정 레이블 데이터셋인 EmoWOZ를 소개합니다. EmoWOZ는 다중 도메인 과제 중심 대화 데이터셋인 MultiWOZ를 기반으로 하며, 사용자 발화에 대한 83,000건 이상의 감정 레이블을 포함하는 11,000건 이상의 대화를 포함합니다. MultiWOZ의 워즈드-오브-오즈(Wizard-of-Oz) 대화 외에도, 동일한 도메인 범위 내에서 인간-기계 대화를 추가로 수집하여 데이터 기반 대화 시스템의 수명 주기 동안 발생할 수 있는 다양한 감정을 충분히 포괄하였습니다. 우리 지식에 따르면, 이는 세계 최초의 대규모 오픈소스형 데이터셋입니다. 또한 과제 중심 대화에 특화된 새로운 감정 레이블링 체계를 제안하였으며, 이 데이터셋이 과제 중심 대화에서 감정 인식 및 상태 추적(task-oriented state tracking)에 유용함을 보여주는 실험 결과를 제시합니다.