HyperAIHyperAI

Command Palette

Search for a command to run...

PsyDTCorpus – Digitaler Zwillingsdatensatz Für Psychologische Berater

Date

vor einem Jahr

Size

9.73 MB

Organization

Technische Universität Südchina

Publish URL

github.com

PsyDTCorpus ist ein digitaler Zwillingsdatensatz psychologischer Berater, der 2024 von der School of Future Technology der South China University of Technology – Guangdong Provincial Key Laboratory of Digital Twins veröffentlicht wurde. Das Hauptziel dieses Datensatzes besteht darin, den Sprachstil und die Beratungstechniken eines bestimmten psychologischen Beraters zu simulieren, um die Entwicklung und Schulung des digitalen Zwillingsmodells für psychologische Berater SoulChat2.0 zu unterstützen. Die relevanten Papierergebnisse sindSoulChat: Verbesserung der Empathie-, Zuhör- und Komfortfähigkeiten von LLMs durch Feinabstimmung mit mehrstufigen Empathiegesprächen".

Der PsyDTCorpus-Datensatz zielt auf echte mehrstufige Beratungsfälle eines bestimmten psychologischen Beraters ab und synthetisiert digitale Zwillingsdaten basierend auf 5.000 Einzelrunden-Beratungsproben, um letztendlich 5.000 hochwertige Gesprächsdaten zur psychischen Gesundheit mit dem Sprachstil des Beraters und den Methoden der Anwendung therapeutischer Technologien zu erhalten. Davon werden 4.760 Proben als Trainingssätze verwendet und 240 Proben in mehrere Testproben aufgeteilt. Die Gesamtzahl der Runden im Datensatz beträgt: 90.365, davon beträgt die Anzahl der Runden im Testsatz: 4.311.

Dieser Datensatz verwendet ein innovatives Datengenerierungsframework, das den Sprachstil, die Beratungstechniken echter Berater und die Big Five-Persönlichkeitsmerkmale der Klienten kombiniert, um Daten zu generieren, die eine einzelne Gesprächsrunde simulieren. Mithilfe dieses Rahmens konnte das Forschungsteam mehrere Runden von Gesprächsdaten generieren, die den Sprachstil und die Anwendung von Beratungstechniken durch bestimmte Berater effektiv charakterisierten. In diesem Projekt erreichte die Gesamtzahl der generierten Dialogdaten mit mehreren Runden 90.365 Runden, und jede Dialogprobe enthielt im Durchschnitt 18 Runden.

PsyDTCorpus wurde manuell in vier professionellen Dimensionen ausgewertet und verglichen: Gesprächstechnologie, Zustand und Einstellung, Beziehungsaufbau und Therapietechnologie. Die Ergebnisse zeigten, dass es in diesen Aspekten im Vergleich zu anderen Datensätzen erhebliche Verbesserungen gibt. Dies belegt die Machbarkeit der Verwendung einer kleinen Anzahl von Beratungsfällen echter psychologischer Berater zur Erstellung hochwertiger mehrstufiger Gesprächsdaten zur psychischen Gesundheit.

Datenthemenverteilung

PsyDTCorpus.torrent
Seeding 1Downloading 0Completed 187Total Downloads 520
  • PsyDTCorpus/
    • README.md
      2.47 KB
    • README.txt
      4.95 KB
      • data/
        • PsyDTCorpus.zip
          9.73 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp