HyperAI초신경

PsyDTCorpus 심리 상담사 디지털 트윈 데이터 세트

* 이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

PsyDTCorpus는 2024년에 남중국이공대학 미래기술학원 광둥성 디지털 트윈 핵심연구실에서 출시한 심리상담사의 디지털 트윈 데이터 세트입니다. 이 데이터 세트의 핵심 목표는 특정 심리 상담사의 언어 스타일과 컨설팅 기술을 시뮬레이션하여 심리 상담사 디지털 트윈 모델 SoulChat2.0의 개발과 교육을 지원하는 것입니다. 관련 논문 결과는 다음과 같습니다.SoulChat: 다중 턴 공감 대화를 통한 미세 조정을 통해 LLM의 공감, 경청 및 편안함 능력 향상".

PsyDTCorpus 데이터 세트는 특정 심리 상담사의 실제 여러 라운드 상담 사례를 대상으로 하며, 5,000개의 단일 라운드 상담 샘플을 기반으로 디지털 트윈 데이터를 합성하여 최종적으로 상담사의 언어 스타일과 치료 기술 적용 방법이 적용된 5,000개의 고품질 정신 건강 대화 데이터를 얻습니다. 그중 4,760개의 샘플은 훈련 세트로 사용되고, 240개의 샘플은 여러 개의 테스트 샘플로 분할됩니다. 데이터 세트의 총 라운드 수는 90,365이고, 그 중 테스트 세트의 라운드 수는 4,311입니다.

이 데이터 세트는 실제 상담사의 언어 스타일, 상담 기술, 고객의 빅 5 성격 특성을 결합하는 혁신적인 데이터 생성 프레임워크를 사용하여 단일 라운드 대화를 시뮬레이션하는 데이터를 생성합니다. 연구팀은 이 프레임워크를 사용하여 특정 상담사의 언어 스타일과 상담 기술 적용을 효과적으로 특성화하는 여러 라운드의 대화 데이터를 생성할 수 있었습니다. 이 프로젝트에서 생성된 다중 라운드 대화 데이터의 총 수는 90,365 라운드에 달했으며, 각 대화 샘플에는 평균 18 라운드가 포함되었습니다.

PsyDTCorpus는 대화 기술, 상태 및 태도, 관계 구축, 치료 기술이라는 4가지 전문적인 측면에서 수동으로 평가 및 비교되었습니다. 연구 결과에 따르면, 다른 데이터 세트와 비교했을 때 이런 측면에서 상당한 개선이 있었고, 실제 심리 상담사의 소수 상담 사례를 사용하여 고품질의 다단계 정신 건강 대화 데이터를 구축하는 것이 가능하다는 것이 입증되었습니다.

데이터 주제 분포

PsyDTCorpus.torrent
시딩 2다운로드 중 0완료됨 66총 다운로드 횟수 221
  • PsyDTCorpus/
    • README.md
      2.47 KB
    • README.txt
      4.95 KB
      • data/
        • PsyDTCorpus.zip
          9.73 MB