CPED 중국어 대화 데이터 세트

CPED는 정식 명칭이 Chinese Personalized and Emotional Dialogue로, 최초의 대규모 중국 개인화 및 감정 대화 데이터 세트입니다. 데이터 세트는 공감과 개인적 특성과 관련된 다중 소스 지식(성별, 5가지 성격 특성, 13가지 감정, 19가지 대화 행동, 10가지 시나리오 등의 지식 포함)으로 구성되어 있습니다.
데이터 세트에는 다음이 포함됩니다.:
- 133000 다중 모드 맥락적 담론
- 40개 TV 쇼에서 392명의 화자가 나눈 12,000개 이상의 대화
- 3가지 캐릭터 속성(이름, 성별, 나이) 주석, 5가지 성격 특성 주석, 2가지 동적 감정 정보(감정 및 감정) 주석, DA 주석
- 세 가지 과제: 대화에서의 성격 인식(PRC), 대화에서의 감정 인식(ERC), 개인화되고 감정적인 대화(PEC)