PsyDTCorpus – Digitaler Zwillingsdatensatz Für Psychologische Berater
Datum
Größe
Veröffentlichungs-URL
Tags
* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.
PsyDTCorpus ist ein digitaler Zwillingsdatensatz psychologischer Berater, der 2024 von der School of Future Technology der South China University of Technology – Guangdong Provincial Key Laboratory of Digital Twins veröffentlicht wurde. Das Hauptziel dieses Datensatzes besteht darin, den Sprachstil und die Beratungstechniken eines bestimmten psychologischen Beraters zu simulieren, um die Entwicklung und Schulung des digitalen Zwillingsmodells für psychologische Berater SoulChat2.0 zu unterstützen. Die relevanten Papierergebnisse sindSoulChat: Verbesserung der Empathie-, Zuhör- und Komfortfähigkeiten von LLMs durch Feinabstimmung mit mehrstufigen Empathiegesprächen".
Der PsyDTCorpus-Datensatz zielt auf echte mehrstufige Beratungsfälle eines bestimmten psychologischen Beraters ab und synthetisiert digitale Zwillingsdaten basierend auf 5.000 Einzelrunden-Beratungsproben, um letztendlich 5.000 hochwertige Gesprächsdaten zur psychischen Gesundheit mit dem Sprachstil des Beraters und den Methoden der Anwendung therapeutischer Technologien zu erhalten. Davon werden 4.760 Proben als Trainingssätze verwendet und 240 Proben in mehrere Testproben aufgeteilt. Die Gesamtzahl der Runden im Datensatz beträgt: 90.365, davon beträgt die Anzahl der Runden im Testsatz: 4.311.
Dieser Datensatz verwendet ein innovatives Datengenerierungsframework, das den Sprachstil, die Beratungstechniken echter Berater und die Big Five-Persönlichkeitsmerkmale der Klienten kombiniert, um Daten zu generieren, die eine einzelne Gesprächsrunde simulieren. Mithilfe dieses Rahmens konnte das Forschungsteam mehrere Runden von Gesprächsdaten generieren, die den Sprachstil und die Anwendung von Beratungstechniken durch bestimmte Berater effektiv charakterisierten. In diesem Projekt erreichte die Gesamtzahl der generierten Dialogdaten mit mehreren Runden 90.365 Runden, und jede Dialogprobe enthielt im Durchschnitt 18 Runden.
PsyDTCorpus wurde manuell in vier professionellen Dimensionen ausgewertet und verglichen: Gesprächstechnologie, Zustand und Einstellung, Beziehungsaufbau und Therapietechnologie. Die Ergebnisse zeigten, dass es in diesen Aspekten im Vergleich zu anderen Datensätzen erhebliche Verbesserungen gibt. Dies belegt die Machbarkeit der Verwendung einer kleinen Anzahl von Beratungsfällen echter psychologischer Berater zur Erstellung hochwertiger mehrstufiger Gesprächsdaten zur psychischen Gesundheit.
